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e Introducao « 


A mente é bem mais ampla do que o céu - 
Se lado a lado os tens - 

Com folga este naquela caberda - 
Cabendo-te também - 

A mente é mais profunda do que o mar - 
De azul a azul - verds - 

Tal como a esponja - o balde - ira conter - 
A mente o absorvera - 

A mente é tao pesada quanto Deus - 

Se na balanca os pdes - 

Serao iguais - ou quase - tal e qual 

A silaba eo som 

Emily Dickinson 


omo fendmeno mais importante do universo, a 
C intelig@ncia @ capaz de transcender as _ limitacgdes 
naturais e de transformar o mundo a sua propria imagem. 
Em maos humanas, nossa inteligéncia nos permitiu superar 
as restri¢des de nossa heranca biolégica, mudando-nos ao 
longo desse processo. Somos a Unica espécie que faz isso. 

A historia da inteligéncia humana comeca com um 
universo Capaz de codificar informacoes. Esse foi o fator que 
permitiu que a evolucgao acontecesse. Como o universo se 
tornou assim ja é€ uma historia interessante. O modelo- 
padrao da fisica tem dezenas de constantes que precisam 
ser precisamente o que sao, do contrario os atomos nao 
teriam sido possiveis e nao existiriam estrelas, planetas, 


cérebros e livros sobre cérebros. O fato de as leis da fisica 
serem afinadas com tanta precisao a ponto de permitirem a 
evolucao da informacao parece incrivelmente improvavel. 
Contudo, pelo principio antrépico, nao estariamos falando 
sobre ela se nao fosse esse 0 caso. Onde algumas pessoas 
veem a mao divina, outras veem um multiverso gerando 
uma evolugao de universos, em que aqueles mais 
enfadonhos (que nao produzem informacao) vao morrendo. 
Mas, independentemente de como nosso universo se tornou 
como é, podemos comecar nossa histéria com um mundo 
baseado em informacoes. 

A historia da evolucao se desenvolve em _ niveis 
crescentes de abstracao. Atomos - especialmente atomos de 
carbono, capazes de criar ricas estruturas de informacao ao 
se ligarem em quatro direcoes diferentes - formaram 
moléculas cada vez mais complexas. Como resultado, a 
fisica deu origem a quimica. 

Um bilhao de anos depois, houve a evolugcao de uma 
molécula complexa chamada DNA, que conseguia codificar 
com precisao extensos filamentos de informacao e gerar 
organismos descritos por esses “programas”. Como 
resultado, a quimica deu origem a biologia. 

Num ritmo incrivelmente rapido, organismos 
desenvolveram redes de comunicacao e decisao chamadas 
sistemas nervosos, Capazes de coordenar as partes cada vez 
mais complexas de seus corpos, bem como_ os 
comportamentos que facilitavam sua sobrevivéncia. Os 
neurénios que formavam sistemas nervosos agregaram-se 
em cérebros capazes de comportamentos cada vez mais 
inteligentes. Desse modo, a_ biologia deu origem a 
neurologia, pois agora os cérebros eram a vanguarda do 
armazenamento e da manipulacao da informacao. Logo, 


passamos de atomos para moléculas, para DNA e para 
cérebros. O passo seguinte foi singularmente humano. 

O cérebro dos mamiferos tem uma aptidao distinta que 
nao € encontrada em nenhuma outra classe animal. Somos 
Capazes de pensamento hierdrquico, de compreender uma 
estrutura formada por elementos distintos e dispostos num 
padrao, de representar essa diSposi¢ao por meio de um 
simbolo e, depois, de usar esse simbolo como um elemento 
de uma configuracgao ainda mais complexa. Essa capacidade 
acontece numa estrutura cerebral chamada neocortex que, 
nos humanos, atingiu um grau tao elevado de sofisticacao e 
de capacidade que somos capazes de chamar esses padroes 
de ideias. Através de um processo recursivo incessante, 
somos capazes de elaborar ideias cada vez mais complexas. 
Damos a essa vasta gama de ideias recursivamente 
associadas 0 nome de conhecimento. S6 0 Homo sapiens 
tem uma base de conhecimentos que se desenvolve, cresce 
exponencialmente e 6 passada de uma geracao para outra. 

Nossos cérebros deram origem a mais um nivel de 
abstracao, pois usamos a inteligéncia deles aliada a outro 
fator de capacitag¢ao: uma extremidade de oposicao - o 
polegar - para manipular o ambiente e- construir 
ferramentas. Essas ferramentas representaram uma nova 
forma de evolucao, pois a neurologia deu origem a 
tecnologia. Nossa base de conhecimentos s6 conseguiu 
crescer sem limites em funcao de nossas ferramentas. 

Nossa primeira invencao foi a histdéria: a linguagem 
escrita, que nos permitiu representar ideias por meio de 
manifestacoes orais distintas. Com a invencao subsequente 
da linguagem escrita, desenvolvemos formas diferentes para 
simbolizar nossas ideias. Bibliotecas de linguagem escrita 
ampliaram a capacidade de nossos cérebros desassistidos 


para reter e aumentar nossa base de conhecimentos a base 
de ideias recursivamente estruturadas. 

Ainda se discute se outras espécies, como os chimpanzés, 
tém a capacidade de expressar ideias hierarquicas por meio 
da linguagem. Os chimpanzés sao capazes de aprender um 
conjunto limitado de simbolos da linguagem de sinais, que 
eles uSam para se comunicar com _ seus treinadores 
humanos. Fica claro, porém, que ha limites distintos para a 
complexidade das estruturas de conhecimento com as quais 
os chimpanzés sao capazes de lidar. As frases que 
conseguem expressar limitam-se a sequéncias simples de 
substantivos e verbos; eles nao sao capazes de manifestar a 
vastidao indefinida da complexidade, caracteristica dos 
humanos. Para ter um exemplo divertido da complexidade 
da linguagem gerada pelos humanos, leia uma das 
espetaculares frases com varias paginas de extensao numa 
historia ou romance de Gabriel Garcia Marquez - sua historia 
de seis paginas, “A Ultima Viagem do Fantasma”, € uma 
unica frase, e funciona bem tanto em espanhol como na 
traducao em inglés [1] 

A ideia principal em meus trés livros anteriores sobre 
tecnologia (The age of intelligent machines, escrito na 
década de 1980 e publicado em 1989; A era das maquinas 
espirituais, escrito entre meados e final da década de 1990 e 
publicado em 1999; e The singularity is near, escrito no 
inicio da década de 2000 e publicado em 2005) é& que um 
processo evolutivo se acelera intrinsecamente (em funcao 
de niveis cada vez mais abstratos) e que seus produtos 
crescem exponencialmente em complexidade e capacidade. 
Chamo este fenédmeno de Lei dos Retornos Acelerados (LRA), 
que pertence tanto a evolucao bioldgica como a tecnoldgica. 


ts 


O exemplo mais drastico da LRA é o crescimento 





eminentemente previsivel na capacidade, no prego e no 
desempenho das tecnologias da informacao. O processo 
evolutivo da_ tecnologia levou’ inevitavelmente ao 
computador, que, por sua vez, permitiu uma vasta expansao 
de nossa base de conhecimentos, facilitando muitos 
vinculos entre uma area de conhecimentos e outra. A Web é, 
em si, um exemplo poderoso e adequado da capacidade de 
um sistema hierarquico de abranger uma vasta gama de 
conhecimentos, preservando sua estrutura inerente. O 
proprio mundo € intrinsecamente hierarquicos: arvores 
contém galhos; galhos contém folhas; folhas contém veios. 
Prédios contém andares; andares contém cémodos; cO6modos 
contém portas, janelas, paredes e pisos. 

Também desenvolvemos ferramentas que agora nos 
permitem compreender nossa prdpria biologia em termos 
precisos. Estamos realizando rapidamente a engenharia 
reversa dos processos de informacao subjacentes a biologia, 
inclusive a de nossos cérebros. Agora, possuimos o cddigo 
objetivo da vida na forma do genoma humano, uma 
realizacao que, em si, ja foi um exemplo extraordinario de 
crescimento exponencial, uma vez que a quantidade de 
dados genéticos que Oo mundo sequenciou tem quase 
dobrado a cada ano, nos ultimos 20 anos [2]. Agora, temos a 
Capacidade de simular em computadores 0 modo como as 
sequéncias de pares de bases dao origem a sequéncias de 
aminoacidos que se desdobram em proteinas 
tridimensionais, a partir das quais toda a biologia é 
construida. A complexidade das proteinas para as quais 
podemos’~ simular desdobramentos tem  aumentado 
constantemente, na medida em que oS_ recursos 
computacionais continuam a crescer exponencialmente [3]. 
Também podemos simular 0 modo como as _ proteinas 


interagem umas com as outras numa complexa danca 
tridimensional de forcas atémicas. Nosso conhecimento 
crescente da _ biologia @ uma importante faceta da 
descoberta dos segredos inteligentes que a evolucao nos 
conferiu, bem como o uso desses paradigmas de inspiracao 
bioldgica para criar tecnologias cada vez mais inteligentes. 

Atualmente, ha um grande projeto em andamento que 
envolve muitos milhares de cientistas e engenheiros, 
trabalhando para conhecer o melhor exemplo que temos de 
um processo inteligente: O cérebro humano. 
Indiscutivelmente, € 0 mais importante esforco na historia 
da civilizagao homem-maquina. Em The singularity is near, 
defendi a ideia de que um corolario da lei dos retornos 
acelerados € que é provavel que nao existam outras 
espécies inteligentes. Para resumir meu argumento, se elas 
existissem, nds as teriamos notado, tendo em vista o tempo 
relativamente breve decorrente entre a posse de uma 
tecnologia tosca por uma civilizagao (lembre-se de que em 
1850 o meio mais rapido de enviar informacdes nos EUA era 
o Pony Express) e a posse de uma tecnologia que pode 
transcender seu proprio planeta [4]. Segundo essa 
perspectiva, a engenharia reversa do cérebro humano pode 
ser considerado o projeto mais importante do universo. 

A meta do projeto € compreender exatamente como o 
cérebro humano funciona, uSando depois esses métodos 
revelados para nos compreendermos melhor, para consertar 
o cérebro quando necessario e - 0 que é muito relevante 
para o tema deste livro - para criar maquinas ainda mais 
inteligentes. Leve em conta o fato de que amplificar 
bastante um fendmeno natural @€ exatamente o que a 


engenharia € capaz de fazer. Como exemplo, pense no 
fendmeno um tanto sutil do principio de Bernoulli, que 





afirma que a pressao sobre uma superficie curva moével é 
levemente menor do que sobre uma superficie plana mével. 
A matematica que explica como o principio de Bernoulli 
produz o erguimento de uma aSa ainda nao foi plenamente 
entendida pelos cientistas, mas a engenharia acolheu essa 
delicada percepcao, concentrou-se em seus poderes e criou 
todo o universo da aviacao. 

Neste livro, apresento uma tese que chamei de teoria da 
mente baseada em reconhecimento de padroes (TMRP), que, 
segundo exponho, descreve o algoritmo basico do neocértex 
(a regiao do cérebro responsavel pela percepcao, pela 
memoria e pelo pensamento critico). Nos capitulos a seguir, 
descrevo como as pesquisas neurocientificas mais recentes, 
bem como nossos prdéprios experimentos mentais, levam a 
inevitavel conclusao de que esse método é usado 
consistentemente pelo neocdrtex. A implicacao da TMRP, 
combinado com a LRA, 6 que seremos capazes de criar a 
engenharia para esses principios, ampliando imensamente 
os poderes de nossa propria inteligéncia. 

Na verdade, esse processo ja se encontra em andamento. 
Ha centenas de tarefas e de atividades que antes eram 
exclusivamente da alcada da inteligéncia humana e que 
hoje podem ser realizadas por computadores, geralmente 
com precisao maior e numa escala amplamente maior. Todas 
as vezes que vocé envia um e-mail ou faz uma chamada 
pelo celular, algoritmos  inteligentes direcionam a 
informagao de _ forma. otimizada. Submeta-se a um 
eletrocardiograma e ele vira com um _ diagndstico 
informatizado que rivaliza com o dos médicos. O mesmo se 
aplica a imagens de células sanguineas. Algoritmos 
inteligentes detectam automaticamente fraudes em cartdes 
de crédito, fazem avides decolar e pousar, guiam sistemas 


de armas inteligentes, ajudam a idealizar produtos com 
design inteligente auxiliado por computador, mantém o 
controle de niveis de estoque em tempo real, montam 
produtos em fabricas robotizadas, e jogam jogos como 
xadrez e até o sutil jogo de Go, em niveis magistrais. 

Milhoes de pessoas viram 0 computador da IBM chamado 
Watson jogar o jogo de linguagem natural chamado 
Jeopardy! e obter um resultado melhor do que a soma dos 
resultados dos dois melhores jogadores humanos do mundo. 
Devo ressaltar que Watson nao so leu e “compreendeu” a 
linguagem sutil das perguntas de /eopardy! (que incluem 
fendmenos como trocadilhos e metaforas), mas também 
adquiriu por conta prdpria o conhecimento de que 
necessitava para produzir uma _ resposta mediante a 
compreensao de centenas de milhOes de documentos em 
linguagem natural, = inclusive Wikipédia e  outras 
enciclopédias. Ele precisou dominar praticamente todas as 
areas da atividade intelectual humana, inclusive historia, 
ciéncia, literatura, artes, cultura e outras. Agora, a IBM esta 
trabalhando com a Nuance Speech Technologies (antes 
chamada Kurzweil Computer Products, minha primeira 
empresa) numa nova versao de Watson que lera literatura 
médica (basicamente todas as revistas médicas e os 
principais blogs médicos) para se tornar um mestre em 
diagnoésticos e em consultas médicas, usando tecnologias de 
compreensao de linguagem clinica da Nuance. Alguns 
observadores dizem que Watson nao “compreende” de fato 
as perguntas de Jeopardy! e nem as enciclopédias que |é 
porque esta apenas fazendo uma “analise estatistica”. Um 
ponto-chave que vou descrever aqui é€ que as técnicas 
matematicas que foram desenvolvidas no campo da 
intelig@ncia artificial (como aquelas usadas no Watson e no 


Siri, oO assistente do iPhone) sao muito similares em termos 
matematicos aos métodos pelos quais a biologia evoluiu na 
forma do neocortex. Se compreender uma linguagem e 
outros fenédmenos por meio de analises estatisticas nao 
conta como entendimento real, entao os seres humanos 
também nao tém entendimento. 

A capacidade de Watson para dominar inteligentemente 
Oo conhecimento em documentos redigidos em linguagem 
natural logo estara chegando aos mecanismos de pesquisa. 
As pessoas ja conversam com seus telefones em linguagem 
natural (via Siri, por exemplo, também uma contribuicgao da 
Nuance). Esses’ assistentes de _ linguagem natural 
rapidamente se tornarao mais inteligentes a medida que 
métodos semelhantes aos de Watson forem mais usados e 
conforme o proprio Watson continuar a evoluir. 

Os carros do Google que se dirigem sozinhos ja 
percorreram mais de 320 mil quilémetros nas 
congestionadas metrdpoles e cidades da Califérnia (um 
numero que, sem duvida, estara bem maior quando este 
livro chegar as prateleiras reais e virtuais). Ha muitos outros 
exemplos de inteligéncia artificial no mundo de hoje, e 
muitos outros no horizonte. 

Como exemplos adicionais da LRA, a resolucao espacial 
da varredura cerebral e a quantidade de dados que estamos 
reunindo sobre o cérebro estao dobrando a cada ano. 
Estamos demonstrando ainda que podemos transformar 
esses dados em modelos funcionais e simulacgdes das regides 
cerebrais. Tivemos sucesso em fazer a engenharia reversa 
de funcdes importantes do céortex auditivo, no qual 
processamos informacées sobre os sons; do cértex visual, no 
qual processamos informacgoes da viSao; e do cerebelo, no 


qual formamos parte de nossas habilidades (como a de 
pegar uma bola no ar). 

A vanguarda do projeto para compreender, modelar e 
simular o cérebro humano @€ a engenharia reversa do 
neocortex cerebral, no qual realizamos o pensamento 
hierarquico recursivo. O cértex cerebral, responsavel por 
80% do cérebro humano, € composto de uma estrutura 
altamente repetitiva, permitindo que os humanos criem 
arbitrariamente estruturas de ideias complexas. 

Na teoria da mente baseada em reconhecimento de 
padroes, descrevo um modelo de como o cérebro humano 
adquire essa capacidade critica, usando uma _ estrutura 
muito inteligente, definida pela evolucao bioldgica. Ha 
detalhes nesse mecanismo cortical que ainda nao 
entendemos plenamente, mas conhecemos o suficiente 
sobre as funcoes que ele necessita realizar para podermos 
projetar algoritmos que satisfazem o mesmo propdosito. Ao 
comecarmos a compreender o neocdrtex, colocamo-nos em 
posi¢ao de ampliar bastante seus poderes, assim como o 
mundo da aviacgao ampliou muito os poderes do principio de 
Bernoulli. O principio operacional do neocdrtex 64, 
indubitavelmente, a ideia mais importante do mundo, pois é 
Capaz de representar qualquer conhecimento e habilidade, 
além de criar novos conhecimentos. Afinal, o neocdértex foi o 
responsavel por cada romance, cada melodia, cada quadro, 
cada descoberta cientifica, além de tantos outros produtos 
do pensamento humano. 

Ha uma grande necessidade, no campo da neurociéncia, 
de uma teoria que una as observacoes extremamente 
disparatadas e extensas que nos sao relatadas diariamente. 
Uma teoria unificada 6 uma necessidade crucial em todas as 
grandes areas da ciéncia. No capitulo 1, descrevo como dois 


sonhadores unificaram a biologia e a fisica, areas que antes 
pareciam irremediavelmente desorganizadas e variadas, e 
depois falo sobre como tal teoria pode ser aplicada ao 
cenario do cérebro. 

Hoje, € comum encontrarmos grandes celebracédes sobre 
a complexidade do cérebro humano. O Google apresenta 
cerca de 30 milhoes de resultados para uma pesquisa sobre 
citacées referentes a esse tema. (E impossivel traduzir isso 
num numero exato de citag¢des encontradas, pois alguns dos 
sites tém diversas citacdes e alguns nao tém nenhuma.) O 
proprio James D. Watson escreveu em 1992 que “o cérebro é 
a ultima e a maior das fronteiras biolédgicas, a coisa mais 
complexa que ja descobrimos em nosso universo”. O autor 
explica por que acredita que “ele contém centenas de 
bilhoes de células interligadas através de trilhoOes de 
conex6ées. O cérebro € surpreendente [5]”. 

Concordo com a opiniao de Watson sobre o fato de o 
cérebro ser a maior fronteira bioldgica, mas o fato de que 
contém muitos bilhdes de células e trilh6es de conexdes nao 
torna necessariamente complexo o seu método primario, se 
conseguirmos identificar padroes facilmente compreensiveis 
(e recriaveis) nessas células e conexdes, em especial 
aqueles macicamente redundantes. 

Vamos pensar no que significa ser complexo. Podemos 
nos perguntar: uma floresta @€ complexa? A_ resposta 
depende da perspectiva que vocé escolhe adotar. Vocé 
poderia perceber que a floresta contém varios milhares de 
arvores, e que cada uma é diferente. Depois, vocé poderia 
notar que cada arvore tem milhares de galhos e que cada 
galho € completamente diferente. Depois, vocé poderia 
descrever as excéntricas ramificagcdes de cada galho. Sua 


conclusao pode ser que a floresta tem uma complexidade 
além de nossos devaneios mais alucinantes. 

Mas essa abordagem seria, literalmente, 0 mesmo que 
nao enxergar a floresta por causa dos galhos. E claro que ha 
muita variacao fractal entre arvores e galhos, mas, para 
compreender corretamente os principios de uma floresta, 
seria melhor comecar identificando os padroes distintos de 
redundancia com variagao estocastica (ou seja, aleatoria) 
encontrados nela. Seria justo dizer que o conceito de uma 
floresta 6 mais simples do que o conceito de uma arvore. 

Assim @ com o cérebro, que tem uma _ enorme 
redundancia similar, especialmente no neocdrtex. Como 
descrevo neste livro, seria justo dizer que ha mais 
complexidade num unico neurénio do que em toda a 
estrutura do neocortex. 

Minha meta neste livro, definitivamente, nao 6 
acrescentar mais uma citacao aos milhdes que ja existem, 
atestando como o cérebro é complexo, mas impressionar o 
leitor com o poder da simplicidade do cérebro. Para isso, 
descrevo como um mecanismo basico e engenhoso para 
identificagao, recordacao e previsao de um padrao, repetido 
no neocdrtex centenas de milhdes de vezes, explica a 
grande diversidade do nosso pensamento. Assim como uma 
diversidade espantosa de organismos provém das diferentes 
combinacodes de valores do cédigo genético encontrado no 
DNA nuclear e mitocondrial, uma fantastica variedade de 
ideias, pensamentos e habilidades forma-se com base nos 
valores dos padrdes (de conexédes e de forcas sinapticas) 
encontrados nos _ nossos_ identificadores de _  padrao 
neocorticais e entre eles. Como disse Sebastian Seung, 
neurocientista do MIT, “a identidade nao esta em nossos 
genes, mas nas conexoes entre nossas células cerebrais [6]”. 





Visao do conjunto de Mandelbrot, uma férmula simples aplicada iterativamente. 
Quando é ampliada na tela, as imagens mudam constantemente, de maneiras 
aparentemente complexas 


Precisamos distinguir entre a verdadeira complexidade 
do desenho e a complexidade aparente. Veja o caso do 
famoso conjunto de Mandelbrot, cuja imagem ha muito tem 
sido um simbolo da complexidade. Para apreciar sua 
aparente complicacao, é interessante fazer um zoom em sua 
imagem (que pode ser acessada através dos links 
mencionados nesta nota [7]). Ha complexidades dentro de 
complexidades ao infinito, e elas sempre sao diferentes. Mas 
a formula - ou desenho - do conjunto de Mandelbrot nao 
poderia ser mais simples. Ela tem seis caracteres: Z = Z? + 
C, sendo que Zé um numero “complexo” (o que significa um 
par de numeros) e Cé uma constante. 

Nao € necessario compreender plenamente a funcao de 


ra 


Mandelbrot para ver que ela é simples. Essa férmula é 


aplicada iterativamente e em cada nivel de uma hierarquia. 
O mesmo vale para o cérebro. Sua estrutura repetitiva nao é 
tao simples quanto a da férmula do conjunto de Mandelbrot 
com seis caracteres, mas nem de longe é tao complexa 
quanto poderiam sugerir os milhOes de citagoes sobre a 
complexidade do cérebro. Esse desenho do neocortex se 
repete em todos os niveis da_ hierarquia conceitual 
representada pelo neocdrtex. As metas que tenho neste livro 
foram muito bem sistematizadas por Einstein quando ele diz 
que “qualquer tolo inteligente pode fazer com que as coisas 
fiquem maiores e mais complexas [...] mas é preciso [...] 
muita coragem para seguir na direcao contraria”. 

Até agora, estive falando do cérebro. Mas e a mente? Por 
exemplo, como um neocortex que resolve problemas obtém 
consciéncia? E, ja que estamos no assunto, quantas mentes 
conscientes temos em nosso cérebro? Ha evidéncias que 
sugerem que pode haver mais de uma. Outra questao 
pertinente sobre a mente é: o que 6 livre-arbitrio? Nds o 
temos? Ha experimentos que parecem mostrar que 
comecamos a articular nossas decisOoes antes mesmo de 
estarmos cientes de que as tomamos. Isso implica que o 
livre-arbitrio € uma ilusao? 

Finalmente, que atributos de nosso cérebro' sao 
responsaveis pela formacao de nossa identidade? Serei eu a 
mesma pessoa que era ha seis meses? E claro que nao sou 
exatamente 0 mesmo que eu era, mas terei a mesma 
identidade? Vamos analisar as implicagoes da teoria da 
mente baseada em reconhecimento de padroes para essas 
questoes antiquissimas. 


¢ Capitulo 1 « 


Experimentos mentais pelo mundo 


A teoria darwiniana da selecao natural apareceu muito tarde na 
historia do pensamento. 

Teria sido retardada porque se opunha a verdade revelada, porque 
era um assunto inteiramente novo na historia da ciéncia, porque sé 
era caracteristica de seres vivos, ou porque lidava com propdositos e 
causas finais sem postular um ato de criagao? Creio que nao. Darwin 
simplesmente descobriu o papel da selecao, uma espécie de 
causalidade muito diferente dos mecanismos do tipo puxa-empurra 
que a ciéncia adotara até entao. A origem de uma variedade 
fantastica de coisas vivas poderia ser explicada pela contribuicao 
dada por novas caracteristicas, possivelmente de origem aleatoria, 
para a _ sobrevivéncia. As ci@ncias fisicas ou bioldgicas nao 
apresentavam nada ou quase nada que prenunciasse a selecao 
como principio causal. 

- B. F. Skinner 


Nada € sagrado, em ultima analise, exceto a integridade de sua 
propria mente. 
- Ralph Waldo Emerson 


Uma metafora da geologia 


No final do século 19, os gedlogos se dedicaram a uma 
questao fundamental. Grandes cavernas e canions, como o 
Grand Canyon nos Estados Unidos e a Garganta Vikos na 


Grécia (Supostamente o canion mais profundo da Terra), 
existiam por todo o planeta. Como surgiram essas formacoes 
majestosas? 

Invariavelmente, houve um curso de agua que se 
aproveitou da oportunidade de percorrer essas estruturas 
naturais, mas, antes de meados do século 19, parecia 
absurdo supor que esses suaves riachos poderiam ser os 
criadores de vales e penhascos tao grandes. O gedlogo 
britanico Charles Lyell (1797-1875), porém, propdés que foi 
mesmo oO movimento da agua que escavou' essas 
importantes modificacdes geoldgicas ao longo de grandes 
periodos de tempo, essencialmente um grao de pedra por 
vez. Essa proposta foi recebida inicialmente com ironia, mas 
em duas décadas a tese de Lyell adquiriu a aceitacao da 
maioria. 

Uma das pessoas que observou cuidadosamente a 
resposta da comunidade cientifica a tese radical de Lyell foi 
oO naturalista inglés Charles Darwin (1809-1882). Pense na 
situacao da biologia por volta de 1850. O campo era de uma 
complexidade sem fim, diante das incontaveis espécies de 
animais e plantas, cada uma muito complicada. Pior, a 
maioria dos cientistas resistia a qualquer tentativa de 
apresentar uma teoria unificada sobre a_ extraordinaria 
variacao da natureza. Essa diversidade servia de testamento 
a gloria da cria¢ao de Deus, para nao falar da inteligéncia 
dos cientistas capazes de domina-la. 

Darwin abordou o problema da idealizag¢ao de uma teoria 
geral das espécies mediante uma analogia com a tese de 
Lyell para justificar as mudancgas’ graduais_ nas 
caracteristicas das espécies ao longo de muitas geracoes. 
Ele combinou essa percepcao com_- seus_ proprios 
experimentos mentais e observacoes em sua famosa A 


viagem do Beagle. Darwin argumentou que, a cada geracao, 
os individuos mais capazes de sobreviver em seu nicho 
ecolégico seriam os individuos que criariam a geracao 
seguinte. 

Em 22 de novembro de 1859, o livro de Darwin, A origem 
das espécies, foi posto a venda, e nele o autor deixou clara 
sua divida para com Lyell: 


Estou ciente de que esta doutrina da selecdao natural, exemplificada 
pelos casos imaginarios supracitados, esta aberta as mesmas 
objecdes que a principio foram opostas as nobres posicées de sir 
Charles Lyell sobre “as mudancas modernas da terra, ilustrativas da 
geologia”; mas hoje raramente ouvimos falar que a acgao das ondas 
costeiras, por exemplo, seja trivial e insignificante se aplicada a 
escavacao de vales gigantescos ou a formacdo de longas linhas de 
dunas interiores. A selecao natural so pode operar pela conservacao 
e acumulacao de modificacdes hereditarias infinitesimalmente 
pequenas, cada uma proveitosa ao individuo preservado; e assim 
como a geologia moderna praticamente baniu explicagdes como a 
escavacao de um grande vale apenas por uma Unica onda diluviana, 
a selecao natural, se for um principio verdadeiro, bane a crenca na 
criagao continuada de novos seres organicos, ou de qualquer 
modificagcao importante e repentina em sua estrutura [1]. 


Ha sempre varias razoes para a resist@ncia a novas e 
grandes ideias, e nao é dificil identifica-las no caso de 
Darwin. Que descendiamos nao de Deus, mas de macacos e, 
antes disso, de vermes, nao era algo que agradava a 
diversos criticos. A implicagcao de que nosso caozinho de 
estimacgao era nosso primo, bem como a lagarta, para nao 
mencionar a planta sobre a qual caminhavamos (prima em 
milionésimo ou bilionésimo grau, mas ainda assim uma 
parenta), parecia uma blasf€mia para muita gente. 





Va 


Charles Darwin, autor de A origem das espécies, que definiu a ideia da evolucao 
biolégica 


Mas a ideia se espalhou rapidamente porque dava 
coeréncia ao que antes era uma vasta gama de observacées 
sem relacao aparente. Por volta de 1872, com a publicacao 
da sexta edicao de A origem das espécies, Darwin 
acrescentou esta passagem: “Como registro de um estado 
de coisas anterior, mantive nos paragrafos seguintes [...] 
diversas frases que indicam que os naturalistas acreditam 
na criagao separada de cada espécie; e tenho sido muito 
censurado por ter me expressado assim. Sem duvida, porém, 
foi esta a crenca geral quando a primeira edicao da presente 
obra ffoi langada... Agora, aS coisas mudaram 
completamente, e quase todo naturalista admite o grande 
principio da evolucao [2]”. 


No século seguinte, a ideia unificadora de Darwin foi 
aprofundada. Em 1869, apenas uma década apos a 
publicacao original de A origem das espécies, 0 médico 
suico Friedrich Miescher (1844-1895) descobriu, no nucleo 
das células, uma substancia que ele chamou de “nucleina”, 
que era o DNA [3]. Em 1927, 0 bidlogo russo Nikolai Koltsov 
(1872-1940) descobriu o que ele chamou de uma 
“gigantesca molécula_ hereditaria” que, disse, seria 
composta de “duas fitas especulares que se replicariam de 
maneira semiconservadora usando cada fita como gabarito”. 
Sua descoberta também foi condenada por muitos. Os 
comunistas consideraram-na propaganda fascista, e sua 
morte subita e inesperada foi atribuida a policia secreta da 
Uniao Soviética. Em 1953, quase um século apdos a 
publicagao do livro seminal de Darwin, o bidlogo norte- 
americano James D. Watson (nascido em 1928) e o bidlogo 
inglés Francis Crick (1916-2004) apresentaram a primeira 
caracterizacao precisa da estrutura do DNA, descrevendo-o 
como uma dupla hélice com duas longas moléculas 
enroladas. E interessante comentar que sua descoberta 
baseou-se naquela que hoje 6 conhecida como “foto 51”, 
tirada por sua colega Rosalind Franklin usando cristalografia 
de raios X, que foi a primeira representagao que mostrou a 
hélice dupla. Tendo em vista as descobertas derivadas da 
imagem de Franklin, houve sugestoes de que ela deveria ter 
compartilhado o Prémio Nobel com Watson e Crick. 





Rosalind Franklin tirou a foto critica do DNA (usando cristalografia de raios X) 
que permitiu que Watson e Crick descrevessem com precisao a estrutura do 
DNA pela primeira vez 


Com a descri¢ao de uma molécula que podia codificar o 
programa da biologia, agora se assentava firmemente uma 
teoria unificadora da biologia, que proporcionava uma base 
simples e elegante para a vida. Dependendo apenas dos 
valores dos pares de bases que formavam as fitas de DNA do 
nucleo (e, em menor grau, da mitocéndria), um organismo 
poderia crescer como uma folha de grama ou um ser 
humano. Essa comprovagao nao eliminou aé_ deliciosa 
diversidade da natureza, mas agora compreendemos que a 
extraordinaria diversidade natural deriva do grande 
sortimento de estruturas que podem estar codificadas nessa 
molécula universal. 


Viajando num feixe de luz 


No comeco do século 20, 0 mundo da fisica foi abalado por 
outra série de experimentos mentais. Em 1879, nasceu um 
menino, filho de um engenheiro alemao e de uma dona de 
casa. Ele sO comecou a falar aos 3 anos de idade, e ha 
relatos de que teve problemas na escola aos 9 anos. Aos 16, 
devaneava com a ideia de montar num raio de luar. 

Esse garoto conhecia o experimento realizado pelo 
matematico inglés Thomas Young (1773-1829), que 
determinou que a luz é composta de ondas. A conclusao, na 
€poca, foi que as ondas luminosas devem viajar através de 
algum tipo de meio; afinal, as ondas oceanicas viajavam 
pela agua e as ondas sonoras viajavam pelo ar e por outros 
materiais. Os cientistas deram ao meio pelo qual as ondas 
luminosas viajavam o nome de “éter”. O garoto também 
conhecia o experimento realizado em 1887 pelos cientistas 
norte-americanos Albert Michelson (1852-1931) e Edward 
Morley (1838-1923), que tentou confirmar a existéncia do 
éter. Esse experimento baseou-se na analogia de ir 
correnteza abaixo ou acima, num rio. Se vocé esta remando 
numa velocidade fixa, entao sua velocidade, medida desde 
a margem, sera maior se vocé estiver remando a favor da 
corrente do que contra ela. Michelson e Morley presumiram 
que a luz viajava pelo éter numa velocidade constante (ou 
seja, a velocidade da luz). Eles argumentaram que a 
velocidade da luz do Sol quando a Terra esta se dirigindo ao 
Sol em sua Orbita (medida do ponto de vista da Terra) versus 
sua velocidade aparente quando a Terra esta se afastando 
do Sol deve ser diferente (da ordem de duas vezes a 
velocidade da Terra). Provar isso confirmaria a existéncia do 
éter. No entanto, o que eles descobriram 6 que nao havia 


diferenca na velocidade da luz do Sol passando pela Terra, 
independentemente do ponto em que a Terra estivesse em 
Sua Orbita. Suas descobertas negaram a ideia do “éter”, mas 
oO que aconteceria, entao? Isso continuou a ser um mistério 
durante quase duas décadas. 

Quando esse adolescente alemao imaginou-se montado 
numa onda de luz, ele pensou que deveria estar vendo as 
ondas luminosas congeladas, tal como um trem parece nao 
se mover caso vocé viaje ao lado dele a mesma velocidade 
que o trem. Mas ele percebeu que isso seria impossivel, pois 
se supoe que a velocidade da luz seja_ constante, 
independentemente de seu préprio movimento. Por isso, ele 
imaginou que estaria viajando ao lado do feixe de luz, mas a 
uma velocidade um pouco inferior. E se ele viajasse a 90% 
da velocidade da luz? Se os feixes de luz sao como trens, 
argumentou, entao ele deveria ver o feixe de luz viajando a 
frente dele a 10% da velocidade da luz. De fato, teria de ser 
ISSO que Os Observadores na Terra veriam. Mas sabemos que 
a velocidade da luz € uma constante, conforme mostrara o 
experimento de  Michelson-Morley. Logo, ele veria 
necessariamente o feixe de luz viajando a frente dele na 
velocidade plena da luz. Isso parecia uma contradicao - 
como era possivel? 

A resposta ficou evidente para o rapaz alemao, cujo 
nome, por falar nisso, era Albert Einstein (1879-1955), na 
€poca em que completou 26 anos. Obviamente - para o 
jovem mestre Einstein - o prdprio tempo deve ter 
desacelerado para ele. Ele explica seu raciocinio num texto 
publicado em _1905. Se os observadores na Terra fossem 
observar o reldgio do jovem, eles o veriam batendo dez 
vezes mais devagar. Com efeito, quando ele voltasse para a 
Terra, seu relédgio mostraria que apenas 10% do tempo ter- 


se-ia passado (ignorando, por enquanto, aceleragao e 
desaceleracao). Do seu ponto de vista, porém, o reldgio 
estaria funcionando normalmente, e o feixe de luz ao seu 
lado estaria viajando a velocidade da luz. A reducao na 
propria velocidade do tempo, da ordem de dez vezes (em 
relacao aos reldgios da Terra), explica plenamente as 
aparentes discrepancias de perspectiva. Num extremo, a 
reducao na passagem do tempo chegaria a zero assim que a 
velocidade da viagem atingisse a velocidade da luz; por 
isso, seria impossivel viajar junto com o feixe de luz. Embora 
fosse impossivel viajar a velocidade da luz, descobriu-se que 
nao era impossivel, em termos tedricos, mover-se mais 
depressa do que o feixe de luz. Nesse caso, 0 tempo mover- 
se-ia para tras. 

Essa solu¢ao pareceu absurda para muitos dos primeiros 
criticos. Como 6 que o proprio tempo poderia reduzir seu 
ritmo, apenas com base na velocidade de movimento de 
alguém? Com efeito, durante 18 anos (desde a época do 
experimento de Michelson-Morley), outros pensadores foram 
incapazes de enxergar uma conclusao que para o mestre 
Einstein era tao 6bvia. Muitos dos outros que analisaram 
esse problema no final do século 19 “cairam do cavalo” em 
termos de dar prosseguimento as implicacdes de um 
principio, apegando-se, no lugar disso, a  nocoes 
preconcebidas do funcionamento da realidade. (Talvez eu 
deva mudar essa metafora para “cairam do feixe de |uz”.) 

O segundo experimento mental de Einstein consistiu em 
imaginar que ele eo irmao voavam pelo espaco. Eles estao a 
300 mil quilémetros de distancia. Einstein quer ir mais 
depressa, mas também quer manter constante a distancia 
entre eles. Assim, ele sinaliza a seu irmao com uma lanterna 
cada vez que deseja acelerar. Como ele sabe que vai levar 


um segundo até que o sinal chegue ao irmao, ele espera um 
segundo (apos enviar o sinal) para comecar sua propria 
aceleracao. Cada vez que o irmao recebe o sinal, ele acelera 
imediatamente. Desse modo, os dois irmaos aceleram 
exatamente no mesmo momento, mantendo, portanto, uma 
distancia constante entre eles. 

Agora, porém, vamos pensar no que veriamos se 
estivéssemos em pé na Terra. Se os dois irmaos estivessem 
se afastando de nos (com Albert a frente), pareceria levar 
menos de um segundo para que a luz chegasse até o irmao, 
porque ele esta viajando no sentido da luz. Além disso, 
veriamos o relégio do irmao de Albert desacelerando (pois 
sua velocidade aumenta quando ele esta mais perto de nos). 
Por esses dois motivos, veriamos os dois irmaos se 
aproximando cada vez mais, até acabarem colidindo. Mas, 
do ponto de vista dos dois irmaos, eles manteriam uma 
distancia constante de 300 mil quil6metros. 

Como isso é possivel? A resposta, obviamente, é que as 
distancias se contraem no sentido paralelo ao do movimento 
(mas nao no sentido perpendicular a ele). Logo, os dois 
irmaos Einstein vao ficando menores (presumindo que estao 
voando com a cabeca a frente) a medida em que vao ficando 
mais rapidos. Essa conclusao bizarra deve ter feito Einstein 
perder mais fas no comeco da carreira do que a diferenca na 
passagem do tempo. 

No mesmo ano, Einstein analisou a relacao entre matéria 
e energia com outro experimento mental. O fisico escocés 
James Clerk Maxwell tinha demonstrado, na década de 
1850, que particulas de luz chamadas fétons nao tinham 
massa, Mas mesmo assim tinham momento. Quando crianc¢a, 
eu tinha um aparelho chamado radiémetro de Crookes, que 
consistia num bulbo de lampada hermeticamente selado 


contendo um vacuo parcial e quatro pas que giravam sobre 
um pivo. As pas eram brancas de um lado e pretas do outro. 
O lado branco de cada pa refletia a luz, e o lado preto 
absorvia a luz. (E por isso que se sente menos calor usando 
uma camiseta branca num dia quente do que uma preta.) 
Quando se lancava luz sobre 0 aparato, as pas giravam e as 
faces pretas se afastavam da luz. Essa € uma demonstracao 
direta de que os fétons tem momento suficiente para fazer 
com que as pas do radidmetro se movam. 





Radiédmetro de Crookes - a ventoinha com quatro pas gira quando a luz a 
ilumina 


A questao que Einstein enfrentou € que 0 momento é 
uma funcgao da massa: 0 momento € o produto da massa 
pela velocidade. Logo, uma locomotiva que viaja a 50 
quildmetros por hora tem um momento bem maior, digamos, 
do que um inseto que viaja a mesma velocidade. Como, 
entao, uma particula com massa zero pode ter um momento 
positivo? 

O experimento mental de Einstein consistiu numa caixa 
flutuando no espaco. Emite-se um fdéton dentro da caixa, do 
lado esquerdo para o direito. O momento total do sistema 
precisa ser conservado, e por isso a caixa teria de recuar 
para a esquerda quando o féton fosse emitido. Apés algum 
tempo, o fdton colide com a face direita da caixa, 
transferindo novamente seu momento para a caixa. O 
momento total do sistema é preservado novamente e a Caixa 
para de se movimentar. 

Até aqui, tudo bem. Mas pense no ponto de vista do sr. 
Einstein, que esta vendo a caixa do lado de fora. Ele nao 
percebe nenhuma_ influéncia externa sobre aé_ Caixa: 
nenhuma particula - com ou sem massa - a atinge, e nada 
sai dela. Contudo, o sr. Einstein, segundo o cenario acima, 
vé a Caixa movendo-se temporariamente para a esquerda e 
parando depois. Segundo nossa analise, cada féton deveria 
mover permanentemente a caixa para a esquerda. Como 
nao houve efeitos externos sobre a caixa ou da Caixa, seu 
centro de massa deve permanecer no mesmo lugar. Mas o 
foton dentro da caixa, que se move da esquerda para a 
direita, nao pode mudar o centro de massa, pois nao possui 
massa. 

Ou sera que possui? A conclusao de Einstein foi que, 
como evidentemente o féton tem energia e tem momento, 
também deve ter um equivalente em massa. A energia do 


foton moével é inteiramente equivalente a uma massa movel. 
Podemos calcular o que é essa equivaléncia aceitando que o 
centro de massa do sistema deve manter-se estacionario 
durante o movimento do fdton. Por meio de calculos, 
Einstein mostrou que massa e energia sao equivalentes, 
relacionados por uma constante simples. Contudo, havia 
uma pegadinha: a constante poderia ser simples, mas era 
enorme; era a velocidade da luz ao quadrado (cerca de 1,7 
x 1017 m2/s* - ou seja, 17 seguido de 16 zeros). Assim, 
temos a famosa férmula de Einstein, E = mc? [10]. Com isso, 
uma onca (28 gramas) de massa equivale a 600 mil 
toneladas de TNT. A carta de Einstein datada de 2 de agosto 
de 1939 e enderecada ao presidente Roosevelt informando-o 
do potencial para uma bomba atdémica baseada nesta 
formula inaugurou a era atémica [11]. 

Vocé pode pensar que isso ja devia ser 6bvio antes, tendo 
em vista que os experimentadores perceberam que a massa 
de substancias radiativas decresce como resultado da 
radiacao ao longo do tempo. Presumiu-se, porém, que as 
substancias radiativas continham algum tipo especial de 
combustivel de alta energia que estaria queimando. Essa 
suposi¢ao nao é totalmente errénea; 6 que o combustivel 
sendo “queimado” era simplesmente a massa. 

Ha varios motivos para eu ter comecado este livro com os 
experimentos mentais de Darwin e de Einstein. Antes de 
tudo, eles revelam o extraordinario poder do cérebro 
humano. Sem qualquer equipamento exceto uma caneta e 
papel para desenhar as figuras de palitinhos desses simples 
experimentos mentais e@ para escrever aS equacoes 
razoavelmente simples que resultavam deles, Einstein 
conseguiu derrubar a compreensao do mundo fisico que 


datava de dois séculos, influenciando profundamente o 
curso da historia (inclusive a Segunda Guerra Mundial) e 
prenunciando a era nuclear. 

E verdade que Einstein se baseou em algumas 
descobertas experimentais do século 19, embora esses 
experimentos também nao tenham usado equipamentos 
sofisticados. Também @é verdade que a_ validacao 
experimental subsequente das teorias de Einstein tenha se 
valido de tecnologias avancadas, e se estas nao tivessem 
sido desenvolvidas, nao teriamos tido a validagao que hoje 
temos - que as ideias de Einstein sao auténticas e 
significativas. Contudo, esses fatores nao diminuem o fato 
de que esses famosos experimentos mentais revelam o 
poder do pensamento humano em seu mais elevado grau. 

Einstein @€ geralmente considerado o principal cientista 
do século 20 (e Darwin seria um bom candidato para esse 
titulo no século 19), mas a matematica envolvida em suas 
teorias, em ultima analise, nao @ muito complicada. Os 
proprios experimentos mentais eram simples e diretos. 
Assim, poderiamos nos perguntar de que forma Einstein 
poderia ser considerado particularmente sagaz. Vamos 
discutir depois exatamente o que ele fazia com o proprio 
cérebro quando idealizou suas teorias, e onde se localiza 
essa qualidade. 

Por outro lado, essa histéria também demonstra as 
limitagoes do pensamento humano. Einstein conseguiu 
montar em seu feixe de luz sem cair (embora tenha 
concluido que era impossivel montar de fato num feixe de 
luz), mas quantos milhares de observadores e pensadores 
foram totalmente incapazes de imaginar esses exercicios 
notavelmente simples? Uma falha comum é a dificuldade 
que a maioria das pessoas tem para descartar e transcender 


as ideias e as perspectivas de seus pares. Ha ainda outros 
desajustes, que veremos com mais detalhes apdés termos 
examinado o funcionamento do neocortex. 


Um modelo unificado do neocortex 


O motivo mais importante para que eu compartilhe aqueles 
que devem ser os experimentos mentais mais famosos da 
historia 6 o fato de eu té-los usado como introducao para a 
mesma abordagem em relacao ao cérebro. Como vocé vera, 
podemos avancar bastante no- entendimento do 
funcionamento da intelig@ncia humana gracas a alguns 
experimentos mentais simples que nds mesmos podemos 
fazer. Levando em conta o assunto em questao, os 
experimentos mentais podem ser um método bem 
apropriado. 

Se as divagacgoes de um jovem e o fato de nao usar 
equipamento, exceto caneta e papel, foram suficientes para 
revolucionar nossa compreensao da fisica, entao deveriamos 
ser Capazes de fazer um progresso razoavel num fenédmeno 
com o qual estamos muito mais familiarizados. Afinal, 
lidamos com nossos pensamentos em todos os nossos 
momentos de vigilia - e também nos momentos de sono. 

Apos termos construido um modelo do funcionamento do 
pensamento através desse processo de autorreflexao, vamos 
examinar até que ponto podemos confirma-lo por meio das 
observacgdoes mais recentes de cérebros fisicos e do que ha 
de mais moderno para recriar esses processos nas maquinas. 


¢ Capitulo 2 « 


Experimentos mentais sobre o 
pensamento 


Raramente penso em palavras. O pensamento surge, e talvez eu 
tente expressa-lo em palavras depois. 
- Albert Einstein 


O cérebro 6 uma massa de quase um quilo e meio que podemos 
segurar naS maos e que pode conceber um universo com cem 
bilh6es de anos-luz de extensao. 

- Marian Diamond 


O que parece espantoso 6 que um mero objeto com pouco mais de 
um quilo e trezentos gramas, feito dos mesmos atomos que 
constituem tudo o mais que ha sob o Sol, seja capaz de dirigir 
praticamente tudo aquilo que os humanos fizeram: voar a Lua e 
rebater setenta home runs, escrever Hamlet e construir o Taj Mahal - 
e até desvendar os segredos do proprio cérebro. 

- Joel Havemann 


omecei a pensar sobre 0 pensamento por volta de 1960, 
C O mesmo ano em que descobri o computador. Hoje seria 
bem dificil encontrar um garoto de 12 anos que nao usa um 
computador, mas na €poca havia apenas um punhado deles 
na minha cidade natal, Nova York. Naturalmente, esses 
primeiros aparelhos nao cabiam na mao, € oO primeiro ao qual 


tive acesso ocupava uma Sala grande. No inicio da década 
de 1960, programei um IBM 1620 para realizar uma analise 
de variancia (um teste estatistico) em dados que tinham 
sido coletados estudando um programa para educacao de 
criangas pequenas, um precursor do Head Start. Por isso, 
esse esforco era consideravelmente drastico, pois o destino 
dessa iniciativa educacional de ambito nacional dependia 
de nosso trabalho. Os algoritmos e os dados que 
analisavamos eram complexos a ponto de nao sermos 
Capazes de antever as respostas que o computador daria. 
Evidentemente, as respostas seriam determinadas pelos 
dados, mas nao eram previsiveis. Acontece que a diferenca 
entre ser determinada e ser previsivel é& importante, e 
voltarei depois a ela. 

Lembro-me de como foi emocionante ver as luzes do 
painel frontal diminuirem de intensidade pouco antes de o 
algoritmo terminar suas deliberagoes, como se 0 computador 
estivesse mergulhado em pensamentos. Quando as pessoas 
se aproximavam, ansiosas por obterem o préximo conjunto 
de resultados, eu apontava para as luzes_ piscando 
delicadamente e dizia: “Ele esta pensando”. Era uma piada 
€ nao era - ele parecia mesmo estar contemplando as 
respostas -, e oS membros da equipe comecaram a atribuir 
uma  personalidade a maquina. Talvez fosse uma 
antropomorfizacao, mas me fez comecar a levar seriamente 
em conta o relacionamento entre o pensamento e a 
computacao. 

Para avaliar até que ponto meu proprio cérebro era 
similar aos programas de computador com os quais eu 
estava familiarizado, comecei a pensar no que meu cérebro 
deveria estar fazendo ao processar informac6ées. Faz 50 anos 
que investigo isso. O que vou descrever a seguir a respeito 


do funcionamento do cérebro vai parecer bem diferente do 
que aquilo que entendemos normalmente como um 
computador. Fundamentalmente, porém, o- cérebro 
armazena e processa informacoes, e, por causa da 
universalidade da computag¢ao - um conceito ao qual 
também vou retornar -, ha um paralelo entre cérebros e 
computadores maior do que pode parecer. 

Todas as vezes que faco alguma coisa - ou penso em 
alguma coisa -, seja escovar os dentes, praticar num teclado 
musical ou ter uma nova ideia, reflito sobre como fui capaz 
de fazer aquilo. Penso ainda mais, acima de tudo, nas coisas 
que nao sou capaz de fazer, pois as limitacoes do 
pensamento humano proporcionam um conjunto de pistas 
igualmente importante. Pensar tanto sobre o pensamento 
pode até me deixar mais lento, mas tenho a esperanca de 
que esses exercicios de autorreflexao me_ permitirao 
aprimorar meus métodos mentais. 

Para aumentar nossa percepcao do funcionamento do 
cérebro, vamos estudar uma série de experimentos mentais. 

Experimente fazer o seguinte: recite o alfabeto. 

E provavel que vocé se lembre dele desde a infancia e 
consiga recita-lo com facilidade. 

Agora, experimente o seguinte: recite o alfabeto de tras 
para frente. 

A menos que vocé tenha estudado o alfabeto nessa 
ordem, é provavel que vocé ache impossivel recita-lo ao 
contrario. E possivel que alguém que tenha passado um bom 
tempo na sala de aula do primario onde o alfabeto fica a 
mostra consiga evocar Sua memoria visual e lé-lo de tras 
para a frente. Porém, até isso é dificil porque, na verdade, 
nao nos lembramos de imagens inteiras. Recitar o alfabeto 
de tras para a frente deveria ser uma tarefa simples, pois 


requer exatamente as mesmas informacoes necessarias para 
recita-lo na ordem normal, mas _ geralmente nao 
conseguimos fazé-lo. 

Vocé se lembra do numero de seu CPF? Se vocé se 
lembra, consegue recita-lo de tras para a frente sem 
escrevé-lo antes num papel? E a cancao infantil “Nana, 
neném’”? Os computadores conseguem fazer isso de maneira 
trivial. Mas nés nao conseguimos, a menos que estudemos 
especificamente a sequéncia invertida como uma nova 
série. Isso nos diz alguma coisa sobre a forma como a 
memoria humana é organizada. 

Claro, seremos capazes de realizar essa tarefa com 
facilidade se anotarmos a sequéncia e depois a lermos de 
tras para a frente. Ao fazé-lo, estamos usando uma 
tecnologia - a linguagem escrita - para compensar uma das 
limitagoes de nosso pensamento desassistido, embora seja 
uma ferramenta bem antiga. (Foi nossa segunda invencao; a 
primeira foi a linguagem falada.) E por isso que inventamos 
ferramentas: para compensar nossas defici€ncias. 

Isso Sugere que nossasS memorias sao sequenciais e 
ordenadas. Elas podem ser acessadas na ordem em 
que sao lembradas. Nao somos capazes de inverter 
diretamente a sequéncia de uma memoria. 

Também temos dificuldade para iniciar uma memoria no 
meio de uma sequéncia. Se aprendo a tocar uma peca 
musical no piano, geralmente nao consigo comecar num 
ponto arbitrario, como na metade. Ha alguns pontos para os 
quais consigo pular, porque minha memoria sequencial da 
peca é organizada em segmentos. Se eu tentar comecar no 
meio de um segmento, porém, vou precisar voltar a fazer a 
leitura visual até minha memoria sequencial comecar a 
funcionar. 


A seguir, tente fazer o seguinte: recorde-se de uma 
caminhada que vocé fez no dia anterior, por exemplo. Do 
gue vocé consegue se lembrar? 

Esse experimento mental funciona melhor se vocé fez 
uma caminhada bem recentemente, como hoje pela manha, 
ou ontem. (Vocé também pode substituir por um passeio de 
carro ou por qualquer atividade durante a qual tenha se 
deslocado por um terreno.) 

E provavel que vocé nao se lembre muito bem da 
experiéncia. Quem foi a quinta pessoa que vocé encontrou 
(sem incluir as pessoas que vocé conhece)? Vocé viu um 
carvalho? Uma caixa dos correios? O que vocé viu ao dobrar 
a primeira esquina? Se vocé passou por algumas lojas, o que 
havia na segunda vitrine? Talvez vocé consiga reconstruir as 
respostas para algumas dessas perguntas a partir das 
poucas pistas de que consiga se lembrar, mas é provavel 
que se lembre de um numero relativamente pequeno de 
detalhes, embora seja uma experiéncia bem recente. 

Se vocé caminha regularmente, pense na_ primeira 
caminhada que fez no més passado (ou na primeira ida ao 
seu local de trabalho no més passado, caso trabalhe fora de 
casa). Provavelmente, vocé nao vai se lembrar da 
caminhada ou do trajeto especifico, e, mesmo que se 
lembre, sem duvida a quantidade de detalhes lembrada sera 
bem menor que a da caminhada de hoje. 

Mais adiante vou discutir a questao da consciéncia e 
defender a tese de que temos a tendéncia a equiparar a 
consciéncia com nossa memoria de eventos. A principal 
razao para acreditarmos que nao estamos conscientes 
quando anestesiados 6 que nao nos lembramos de nada 
desse periodo (embora haja excecdes intrigantes - e 
perturbadoras - a isso). Logo, com relag¢ao a caminhada que 


fiz nesta manha, eu nao estive consciente na maior parte 
dela? E uma pergunta razoavel, dado que nao me lembro de 
quase nada que vi ou sequer no que estava pensando. 

Ha, porém, algumas coisas de que me lembro da 
caminhada desta manha. Lembro-me de ter pensado neste 
livro, Mas nao saberia dizer exatamente quais foram esses 
pensamentos. Lembro-me ainda de ter passado por uma 
mulher com um carrinho de bebé. Lembro que a mulher era 
atraente e que o bebé era bonitinho. Recordo-me de dois 
pensamentos que tive relacionados a essa experiéncia: Esse 
bebé é adoravel, como meu neto recém-nascido, e O que 
esse bebé estara percebendo em seu ambiente visual? Nao 
consigo me lembrar da roupa que vestiam nem da cor de 
seus cabelos. (Minha mulher vai dizer que isso é tipico.) 
Embora eu nao seja capaz de descrever nada especifico 
sobre a aparéncia da mae, tenho a sensacao inefavel de 
como ela se parecia, e acredito que conseguiria identificar 
seu retrato em meio ao de varias mulheres. Portanto, embora 
talvez eu tenha retido na memoria algum elemento de sua 
aparéncia, se penso na mulher, no carrinho e no bebé, nao 
consigo visualiza-lo. Nao existe fotografia ou video desse 
evento em minha mente. E dificil descrever exatamente o 
que ha em minha mente sobre essa experiéncia. 

Também me lembro de ter passado por outra mulher com 
um carrinho de bebé numa caminhada feita algumas 
semanas antes. Nesse caso, creio que nem conseguiria 
identificar o retrato dessa mulher. Hoje, essa lembranc¢a esta 
muito mais t€nue do que deveria estar logo depois dessa 
caminhada. 

A seguir, pense em pessoas que vocé encontrou uma ou 
duas vezes apenas. Consegue visualiza-las com clareza? Se 
vocé for um artista visual, talvez tenha aprendido essa 


técnica de observacao, mas normalmente nao somos 
Capazes de visSualizar pessoas com as quaisS cruzamos por 
acaso. a ponto de_- desenha-las ou descrevé-las 
suficientemente, mas terfamos pouca dificuldade para 
reconhecer uma foto delas. 

Isso Sugere que nao ha imagens, videos ou registros 
sonoros armazenados no cérebro. Nossas memorias 
sao armazenadas como sequéncias de _ padroes. 
Memorias que nao sao acessadas se desfazem com o 
tempo. Quando os desenhistas da policia entrevistam uma 
vitima de crime, eles nao perguntam “Qual a aparéncia das 
sobrancelhas do autor do delito?”. Eles mostram uma série 
de imagens de sobrancelhas e pedem que a vitima escolha a 
correta. O conjunto correto de sobrancelhas vai ativar a 
identificagao do mesmo padrao que esta armazenado na 
memoria da vitima. 

Agora, vamos estudar rostos que vocé conhece bem. 
Vocé consegue identificar alguma destas pessoas? 





Sem duvida, vocé conseguiu. reconhecer = essas 
personalidades familiares, apesar de estarem parcialmente 
cobertas ou distorcidas. Isso representa um _ talento 
importante da percepcao humana: somos capazes de 
identificar um padrao, mesmo que apenas parte dele 
seja percebida (vista, ouvida, sentida), e mesmo que 
contenha alteracoes. Aparentemente, nossa 
Ccapacidade de identificacao pode detectar 
caracteristicas invariaveis de um_- padrao- - 
caracteristicas que sobrevivem a variagoes do 
mundo real. As evidentes distorcdes de uma caricatura ou 
de certas formas de arte, como o impressionismo, enfatizam 
os padroes de uma imagem (pessoa, objeto) que 
identificamos, mudando outros detalhes. Na verdade, o 
mundo das artes esta a frente do mundo da ciéncia quanto a 
reconhecer o poder do sistema perceptivo humano. USamos 
a mesma abordagem quando identificamos uma melodia a 
partir de poucas notas. 

Agora, estude esta imagem: 
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A imagem @€ ambigua - o canto indicado pela regiao 
escura pode ser um canto interno ou externo. No principio, é 
possivel que vocé veja esse canto como interno ou externo, 
embora, com algum esforco, consiga mudar sua percepcao 
para a interpretacao alternativa. Depois que sua mente fixa 
um entendimento, porém, pode ser dificil enxergar a outra 
perspectiva. (Isso também se aplica a_ perspectivas 
intelectuais.) A interpretagcao que seu cérebro faz da 
imagem na verdade influencia efetivamente aquilo que vocé 
experimenta em relacao a ela. Quando o canto parece ser 
interno, seu cérebro interpreta a regiao cinzenta como uma 
sombra, e por isso ela nao parece tao escura quando vocé 
interpreta o canto como externo. 

Portanto, a experiéncia consciente de nossas 
percepcoes é efetivamente alterada por nossas 
interpretacoes. 

Considere que vemos aquilo que esperamos___ 


Tenho certeza de que vocé conseguiu completar a frase 
acima. 

Se eu tivesse escrito a ultima palavra, vocé teria 
precisado apenas de um vislumbre momentaneo para 
confirmar que ela era aquela que vocé esperava. 

Isso implica que estamos constantemente prevendo o 
futuro e levantando hipoteses sobre aquilo que 
vamos experimentar. Essa expectativa influencia 
aquilo que vemos de fato. Prever o futuro 6, na verdade, 
a principal razao para termos um cérebro. 

Pense numa_ experiéncia pela qual todos passam 
regularmente: uma memoria de anos atras aparece 
inexplicavelmente na cabeca. 

Geralmente, sera a lembranca de uma pessoa ou de um 
evento no qual vocé nao pensava ha um bom tempo. E 
evidente que alguma coisa provocou essa lembranca. A 
sequéncia de pensamentos que a provocou pode ser 
aparente, alguma coisa que vocé € capaz de expressar. 
Noutras ocasides, vocé pode ter nocao da sequéncia de 
pensamentos que levou até essa memoria, mas teria 
dificuldades para expressa-la. No mais das vezes, o gatilho 
se perde rapidamente e a lembranca parece ter surgido do 
nada. Costumo ter essas memorias aleatérias quando faco 
alguma coisa rotineira, como escovar os dentes. As vezes, 
percebo a conexao - a pasta escorrendo da escova pode me 
lembrar da tinta caindo de um pincel numa aula de pintura 
que tive na escola. As vezes, tenho apenas uma vaga 
sensacao da conexao, ou nenhuma. 

Um fenédmeno correlato pelo qual todos passam com 
frequéncia é a tentativa de se lembrar de um nome ou de 
uma palavra. O - procedimento que usSamos_ nessa 
circunstancia @ tentar nos lembrar de gatilhos que podem 


destravar a memoria. (Por exemplo: quem fez o papel da 
Rainha Padmé em A Vinganga dos Sith? Vejamos, 6 a 
mesma atriz que fez um filme sombrio e recente sobre 
danca, Cisne Negro, ah, sim, Natalie Portman.) As vezes, 
adotamos méetodos mneménicos idiossincraticos para 
conseguirmos lembrar. (Por exemplo: Ela 6 sempre esguia, 
nao € grande como uma porta, ah, sim, Portman, Natalie 
Portman.) Algumas de nossas memorias sao robustas o 
suficiente para podermos passar diretamente da pergunta 
(como guem fez o papel da Rainha Amidala) para a 
resposta; normalmente, precisamos passar por uma série de 
gatilhos até encontrar um que funcione. E bem parecido 
com saber o link certo na Internet. As memodrias podem, de 
fato, perder-se como aquela pagina da Internet com a qual 
nenhuma outra pagina tem um link (pelo menos, nenhuma 
pagina que possamos descobrir). 

Ao realizar procedimentos rotineiros - como o ato de 
vestir uma camisa -, observe a prdépria acao e analise até 
gue ponto vocé segue a mesma sequéncia de etapas a cada 
vez. Segundo minha prdpria observacao (e, como mencionei, 
estou sempre tentando me observar), é provavel que vocé 
execute praticamente os mesmos gestos todas as vezes em 
que realiza determinada tarefa rotineira, mesmo que 
adicione alguns mddulos extras. Por exemplo, a maioria das 
minhas camisas nao precisa de abotoaduras, mas, quando 
tenho de usa-las, isso envolve uma série adicional de 
tarefas. 

As listas de etapas na minha mente estado organizadas 
em hierarquias. Sigo um procedimento rotineiro antes de 
dormir. A primeira etapa consiste em escovar os dentes. Mas 
essa acao, por sua vez, é dividida numa série menor de 
etapas, e a primeira delas 6 colocar pasta na escova. Essa 


etapa, por sua vez, é formada por etapas ainda menores, 
como encontrar a pasta, tirar a tampa e assim por diante. A 
etapa de encontrar a pasta também tem etapas, e a primeira 
€ abrir o armario do banheiro. Essa etapa, por sua vez, exige 
etapas, e a primeira delas 6 segurar a porta do armario. Essa 
rede continua numa série muito sutil de movimentos, e por 
isso ha, literalmente, milhares de pequenas acdes formando 
minha rotina noturna. Embora eu possa ter dificuldade para 
me lembrar dos detalhes de uma caminhada que fiz ha 
apenas algumas horas, nao tenho dificuldade para me 
lembrar de todas essas pequenas etapas ao me preparar 
para dormir - a ponto de poder pensar em outras coisas 
enquanto realizo todos esses procedimentos. E importante 
frisar que essa lista nao esta armazenada como uma longa 
relag¢ao com milhares de etapas; de fato, cada um de 
nossos procedimentos de rotina é@€ lembrado como 
uma complexa hierarquia de atividades em camadas. 

O mesmo tipo de hierarquia esta envolvido em 
nossa Capacidade de reconhecer objetos e situacoes. 
Identificamos os rostos das pessoas que conhecemos bem e 
também percebemos que esses rostos contém olhos, nariz, 
boca e assim por diante - uma hierarquia de padroes que 
usamos tanto em nossas percepcoes como em nossas acoes. 
O uso de hierarquias nos permite tornar a usar padroes. Por 
exemplo, nao precisamos reaprender o conceito de nariz e 
de boca todas as vezes que um novo rosto nos 64 
apresentado. 

No préximo capitulo, vamos reunir os resultados desses 
experimentos mentais numa teoria que mostra como o 
neocortex deve funcionar. Vou mostrar que eles revelam 
atributos essenciais e uniformes do pensamento, desde a 
localizacao da pasta de dentes até a criacao de um poema. 


¢ Capitulo 3 « 


Um modelo do neocortex: 
a teoria da mente baseada em 
reconhecimento de padroes 


O cérebro é um tecido. E um tecido complicado, com uma trama 
intricada, como nada do que conhecemos no universo, mas é 
composto de células, como qualquer tecido. Evidentemente, sao 
células altamente especializadas, mas elas funcionam segundo as 
leis que governam quaisquer outras células. Seus sinais elétricos e 
quimicos podem ser detectados, registrados e interpretados, e seus 
componentes quimicos podem ser identificados; as conexdes que 
constituem a rede fibrosa do cérebro podem ser mapeadas. Em 
suma, oO cérebro pode ser estudado, assim como o rim. 

- David H. Hubel, neurocientista 


Suponha que existe uma maquina cuja_ estrutura  produz 
pensamento, sentimento e percepcao; imagine essa maquina 
ampliada, mas preservando aS mesmas proporcoes, para que 
possamos entrar nela como se fosse um moinho. Supondo isso, 
podemos visitar seu interior; mas o que observariamos nele? Nada, 
exceto partes que se empurram e se movem mutuamente, e nunca 
alguma coisa que pudesse explicar a percepcao. 

- Gottfried Wilhelm Leibniz 


Uma hierarquia de padroes 


Repeti milhares de vezes, em inumeros contextos, as 
observacoes e os experimentos simples descritos no capitulo 
anterior. AS conclusOes dessas observacdes limitam 
necessariamente minha explicagcao sobre aquilo que o 
cérebro deve estar fazendo, assim como os experimentos 
simples sobre tempo, espaco e massa realizados no comeco 
e no final do século 19 limitaram necessariamente as 
reflexoes do jovem mestre Einstein sobre o modo de 
funcionamento do universo. Nas discussodes a seguir, vou 
acrescentar mais algumas observacdes bem basicas da 
neurociéncia, tentando evitar os diversos detalhes ainda 
sujeitos a controvérsias. 

Primeiro, permitam-me explicar por que esta secao 
discute especificamente o neocdrtex (do latim, significando 
“nova camada”). Sabemos que o neocortex 6 o responsavel 
por nossa capacidade de lidar com padroes de informacao, 
fazendo-o de forma hierarquica. Animais sem neocortex 
(basicamente os que nao sao mamiferos) nao sao muito 
Capazes de compreender hierarquias [1]. Compreender a 
natureza intrinsecamente hierarquica da realidade e tirar 
proveito dela 6 uma caracteristica unicamente mamifera, e 
resulta do fato de que apenas os mamiferos possuem essa 
estrutura cerebral, que @ recente em termos evolutivos. O 
neocortex 6 o responsavel pela percepcao sensorial, pela 
identificagcao de tudo (desde objetos visuais até conceitos 
abstratos), pelo controle de movimentos, pelo raciocinio 
(desde a orientacao espacial até 0 pensamento racional) e 
pela linguagem - basicamente, por aquilo que consideramos 
ser O “pensar”. 

O neocértex humano, a camada mais externa do cérebro, 
€ uma estrutura fina, basicamente bidimensional, com uma 
espessura de cerca de 2,5 milimetros. Nos roedores, ele tem 





o tamanho de um selo postal e é liso. Uma inovacao 
evolutiva nos primatas é que ele ficou intricadamente 
acomodado sobre o restante do cérebro, com profundas 
ranhuras, rec6nditos e rugas para aumentar a area de sua 
superficie. Devido as suas dobras complexas, o neocdrtex 
forma a maior parte do cérebro humano, sendo responsavel 
por 80% de seu peso. O Homo sapiens desenvolveu uma 
testa grande para acomodar um neocortex ainda maior; em 
particular, temos um lobo frontal onde lidamos com padroes 
mais abstratos relacionados a conceitos de alto nivel. 

Esta estrutura fina é€ formada basicamente por seis 
camadas, numeradas de | (a mais externa) a VI. Os ax6énios 
que emergem dos neurénios nas camadas II e Ill projetam-se 
para outras partes do neocdrtex. Os axdnios (output) das 
camadas V e VI ligam-se principalmente ao exterior do 
neocortex, com o talamo, o tronco encefalico e a medula 
espinhal. Os neurénios da camada IV recebem conexdes 
sinapticas (input) de neurdnios situados fora do neocdrtex, 
especialmente no talamo. O numero de camadas varia 
levemente de regiao para regiao. A camada IV é muito fina 
no cortex motor, pois nessa area ele nao recebe muitos 
estimulos do talamo, do tronco encefalico ou da medula 
espinhal. Por outro lado, no lobo occipital (a parte do 
neocortex que  geralmente @é_~ responsavel pelo 
processamento visual), ha trés subcamadas adicionais que 
podem ser vistas na camada IV, devido aos consideraveis 
estimulos que fluem para essa regiao, inclusive do talamo. 

Uma _ observacgao criticamente importante sobre o 
neocortex é a extraordinaria uniformidade de sua estrutura 
fundamental. O primeiro a perceber isso foi o neurocientista 
norte-americano Vernon Mountcastle (nascido em 1918). Em 
1957, Mountcastle descobriu a organizacgao colunar do 


neocortex. Em 1978, ele fez uma observacao que é€ tao 
importante para a neurociéncia quanto foi para a fisica o 
experimento de Michelson-Morley em 1887 negando o éter. 
Nesse ano, ele descreveu a organizagao notavelmente 
invariavel do neocértex, levantando a hipdtese de que ele 
era formado por um unico mecanismo repetido diversas 
vezes, € propondo a coluna cortical como essa unidade 
basica. As diferencas na altura de certas camadas nas varias 
regides indicadas acima sao simplesmente diferencas na 
quantidade de interconexoes por cujo tratamento essas 
regides sao responsaveis. 

Mountcastle levantou a hipdtese da existéncia de 
minicolunas dentro das colunas, mas essa teoria tornou-se 
controversa porque nao havia demarcac6ées visiveis de tais 
estruturas menores. Contudo, experimentos detalhados 
revelaram que ha, de fato, unidades que se repetem dentro 
da estrutura de neur6énios de cada coluna. Acredito que a 
unidade basica seja um identificador de padroes e que este 
constitui o componente fundamental do neocdrtex. Em 
contraste com a nocgao de uma minicoluna sugerida por 
Mountcastle, nao existe um limite fisico especifico entre 
esses identificadores, pois eles se situam préximos um do 
outro de maneira entretecida, fazendo da coluna cortical 
simplesmente um agregado formado por um grande numero 
deles. Esses identificadores sao capazes de se ligar sozinhos 
uns com os outros ao longo de uma existéncia, de forma que 
a complexa conectividade (entre mddulos) que vemos no 
neocortex nao esta pré-especificada no cddigo genético, 
sendo criada para refletir os padroes que efetivamente 
aprendemos ao longo do tempo. Vou explicar esta tese mais 
detalhadamente, mas afirmo que é assim que o neocortex 
deve se organizar. 


Devemos notar, antes de avancarmos na estrutura do 
neocortex, que é importante criar modelos de sistemas no 
nivel correto. Embora teoricamente a quimica seja baseada 
na fisica e possa ser derivada inteiramente da fisica, na 
pratica essa tarefa seria complicada e inviavel, tanto que a 
quimica estabeleceu suas prdprias regras e modelos. De 
modo analogo, deveriamos poder deduzir as leis da 
termodinamica da_ fisica, mas quando temos uma 
quantidade suficiente de particulas para chama-las de gas e 
nao apenas de um punhado de particulas, resolver as 
equacoes da fisica relativas a cada interacao de particulas 
torna-se desesperador, ao passo que as leis da 
termodinamica funcionam muito bem. Da mesma forma, a 
biologia tem suas prdprias regras e modelos. Uma unica 
célula da ilhota pancreatica € imensamente complicada, 
especialmente se a modelarmos no nivel das moléculas; 
modelar aquilo que o pancreas faz em termos da regulagem 
do nivel de insulina e das enzimas digestivas € uma tarefa 
bem menos complexa. 

O mesmo principio se aplica aos niveis de modelagem e 
de compreensao no cérebro. Claro que é util e necessario 
fazer a engenharia reversa do cérebro para modelar suas 
interacdes no nivel molecular, mas a meta de nosso esforco 
aqui @, basicamente, aprimorar nosso modelo para explicar 
como o cérebro processa informacdes para produzir 
significado cognitivo. 

O cientista norte-americano Herbert A. Simon (1916- 
2001), considerado um dos fundadores do campo da 
intelig@ncia artificial, escreveu eloqguentemente sobre a 
questao de compreender sistemas complexos no nivel 
correto de abstracao. Ao descrever um programa de IA que 


ele idealizou chamado EPAM (sigla em inglés para perceptor 


e€ memorizador elementar), ele escreveu, em 1973: 
“Suponha que vocé tenha decidido compreender o 
misterioso programa EPAM que eu tenho. Eu poderia lhe 
apresentar duas versoes dele. Uma seria [...] a forma na qual 
ele foi efetivamente escrito - com toda a sua estrutura de 
rotinas e sub-rotinas [...] Por outro lado, eu poderia Ihe 
apresentar a versao em linguagem de maquina do EPAM 
apos a traducao ter sido realizada - apos ele ter sido 
achatado, por assim dizer [...] Creio que nao preciso entrar 
em detalhes sobre qual dessas duas versoes proporcionaria 
a descri¢ao mais parcimoniosa, mais significativa, mais 
legitima [...] Nem vou lhe propor a terceira [...] de nao lhe 
apresentar nenhum programa, mas sim as equacoes 
eletromagnéeticas e as condicdes limitrofes a que o 
computador, visto como um sistema fisico, teria de obedecer 
enquanto se comportasse como EPAM. Isso seria 0 apogeu 
da reducao e da incompreensibilidade [3]”. 

Ha mais ou menos meio milhao de colunas corticais num 
neocortex humano, cada uma ocupando um espaco com 
cerca de 2 milfimetros de altura e 0,5 milimetro de largura, 
contendo cerca de 60 mil neurdénios (resultando num total 
aproximado de 30 bilhées de neurdénios no neocortex). Uma 
estimativa aproximada é que cada identificador de padrées 
dentro de uma coluna cortical contenha cerca de cem 
neurdénios; assim, ha ao todo cerca de 300 milhdes de 
identificadores de padroes no neocortex. 

Para analisarmos o funcionamento desses identificadores 
de padroes, vou comecar dizendo que é dificil saber 
precisamente por onde comecar. Tudo  acontece 
simultaneamente no neocértex, de modo que seus processos 
nao t@ém comeco, nem fim. Vou precisar me referir com 
frequéncia a fendmenos que ainda nao expliquei, mas aos 


quais planejo voltar; por isso, seja paciente com essas 
refer€ncias antecipadas. 

Os seres humanos t@m uma capacidade reduzida para 
processar a ldgica, mas uma capacidade muito profunda e 
central pare reconhecer padroes. Para pensar de maneira 
ldgica, precisamos uSar o neocortex, basicamente um 
grande identificador de padroes. Ele nao € 0 mecanismo 
ideal para a realizacao de transformacoes légicas, mas é o 
unico aparato de que dispomos para essa tarefa. Compare, 
por exemplo, 0 modo como um ser humano joga xadrez ao 
modo como funciona um programa tipico de xadrez para 
computador. O Deep Blue, computador que em 1997 
derrotou Garry Kasparov, 0 campeao mundial humano de 
xadrez, era Capaz de analisar as implicacdes lédgicas de 200 
milhoes de posicoes no tabuleiro (representando diferentes 
sequéncias de movimento e contramovimento) por segundo. 
(Por falar nisso, alguns computadores pessoais Sao capazes 
de fazer isso hoje em dia.) Perguntaram a Kasparov quantas 
posicoes ele conseguia analisar a cada segundo, e ele 
respondeu que era menos do que uma. Como, entao, ele foi 
Capaz de chegar a enfrentar o Deep Blue? A resposta é a 
grande capacidade humana de reconhecimento de padroes. 
Entretanto, precisamos treinar esse talento, razao pela qual 
nem todos conseguem jogar xadrez no nivel de um mestre. 

Kasparov aprendeu cerca de 100 mil posicoes do 
tabuleiro. Esse € um numero real - determinamos que um 
mestre humano num campo especifico dominou cerca de 
100 mil parcelas de conhecimento. Shakespeare escreveu 
suas pecas com uns 100 mil sentidos de palavras (usando 
cerca de 29 mil palavras diferentes, a maioria delas de 
diversas maneiras). Sistemas médicos especializados, 
construidos para representar 0 conhecimento de um médico 


humano, mostraram que um especialista médico humano 
tipico dominou cerca de 100 mil conceitos em sua 
especialidade. Identificar uma parcela de conhecimento 
nessa abundancia nao @€ algo objetivo, pois um item 
especifico vai se apresentar de maneira um pouco diferente 
cada vez que nos defrontamos com ele. 

Munido desse conhecimento, Kasparov observa o 
tabuleiro e compara os padroes que ele vé com todas as 100 
mil situagoes de tabuleiro que ele dominou, e faz todas as 
100 mil comparacgdes simultaneamente. Ha um consenso 
quanto a isso: todos os nossos neurénios estao processando 
- levando em conta os padroes - ao mesmo tempo. Isso nao 
significa que todos estao disparando simultaneamente 
(provavelmente, cairiamos no chao se isso acontecesse), 
mas, engquanto realizam seu processamento, levam em 
conta a possibilidade de disparar. 

Quantos padroes o neocdrtex consegue armazenar? 
Precisamos considerar o fenédmeno da redundancia. O rosto 
de um ente querido, por exemplo, nao esta armazenado uma 
vez, mas milhares de vezes. Algumas dessas repeticdoes sao, 
principalmente, a mesma imagem do rosto, enquanto muitas 
mostram diferentes perspectivas dele, sob iluminacao 
diferente, com expressoes diferentes, e assim por diante. 
Nenhum desses padroes repetidos 6 armazenado como uma 
imagem por si so (OU seja, Como grupos bidimensionais de 
pixels). Com efeito, sao armazenados como listas de 
caracteristicas, sendo que os elementos constitutivos de um 
padrao também sao padroes. Mais adiante, vamos descrever 
com mais precisao a aparé€ncia dessas hierarquias de 
caracteristicas e como elas se organizam. 

Se considerarmos que o conhecimento central de um 
especialista consiste em  aproximadamente 100 mil 


“pedacos” de conhecimento (ou seja, padroes), com uma 
redundancia estimada em 100 para 1, isso nos da um 
requisito de 10 milhdes de padroes. Esse conhecimento 
especializado central 6 formado a partir de conhecimentos 
profissionais mais genéricos e amplos, e por isso podemos 
aumentar a ordem de grandeza dos padroes para 30 a 50 
milhoes. Nosso conhecimento de “senso comum” como ser 
humano é maior ainda; a “Sabedoria das ruas”, na verdade, 
exige bem mais do nosso neocortex do que a “Sabedoria dos 
livros”. Se a incluirmos, nossa estimativa excedera bastante 
100 milhoes de padroes, levando em conta o fator de 
redundancia de cerca de 100. Perceba que o fator de 
redundancia esta longe de ser fixo: padrdes muito comuns 
terao um fator de redundancia da ordem de milhares, 
enquanto um fenédmeno extremamente recente pode ter um 
fator de redundancia menor do que 10. 

Como explico a seguir, nossos procedimentos e acoes 
também compreendem padroes, e, do mesmo modo, estao 
armazenados em regides do cortex; por isso minha 
estimativa da capacidade total do neocértex humano é€ da 
ordem de poucas centenas de milhoOes de padroes. Essa 
conta aproximada correlaciona-se bem com o numero de 
identificadores de padroes que estimei antes, 300 milhoes, 
de modo que € uma conclusao razoavel supor que a funcao 
de cada identificador de padrées neocortical € processar 
uma iteragao de um padrao (ou seja, um exemplar em meio 
a tantos exemplares redundantes da maioria dos padr6oes no 
neocortex). Nossas estimativas do numero de padrdes com 
que um cérebro humano é€ capaz de lidar (incluindo a 
necessaria redundancia) e Oo numero de _ identificadores 
fisicos de padroes tém a mesma ordem de grandeza. 
Devemos observar que quando me_=e refiro ao 


“oprocessamento” de um padrao, estou me referindo a todas 
aS coisas que somos capazes de fazer com um padrao: 
aprendé-lo, prevé-lo (inclusive partes dele), reconhecé-lo e 
implementa-lo (Seja pensando mais nele, seja por meio de 
um padrao de movimento fisico). 

Trezentos milhées de processadores de padroes pode 
parecer um numero grande, e de fato foi suficiente para 
permitir que 0 Homo sapiens desenvolvesse a linguagem 
verbal e escrita, todas as nossas ferramentas e tantas outras 
criagoes. Essas invencoes se fizeram com base umas nas 
outras, dando origem ao crescimento exponencial do 
conteudo informativo de tecnologias, conforme descrevo na 
minha lei dos retornos acelerados. Nenhuma outra espécie 
conseguiu isso. Como disse, umas poucas espécies, Como os 
chimpanzés, parecem ter uma capacidade rudimentar para 
compreender e formar linguagem e para usar ferramentas 
primitivas. Afinal, eles também tém um neocértex, mas sua 
Capacidade é limitada em virtude de seu tamanho menor, 
especialmente do lobo frontal. O tamanho de nosso préprio 
neocortex excedeu um nivel que permitiu que nossa espécie 
desenvolvesse ferramentas cada vez maiS_ poderosas, 
inclusive ferramentas que agora nos permitem compreender 
nossa propria inteligéncia. Em ultima andalise, o cérebro 
humano, combinado a tecnologia produzida por ele, 
permitira que criemos um neocortex sintético que contera 
bem mais do que meros 300 milhdoes de processadores de 
padroes. E por que nao um bilhao? Ou um trilhao? 


A estrutura de um padrao 


A teoria da mente baseada em reconhecimento de padroes 
que apresento aqui fundamenta-se no reconhecimento de 


padroes por meio de mddulos de reconhecimento de padroes 
no neocortex. Esses padroes (e os mddulos) organizam-se 
em hierarquias. Logo adiante, diScuto as raizes intelectuais 
dessa ideia, inclusive meu prdprio trabalho com o 
reconhecimento de padrodes hierarquicos, nas décadas de 
1980 e 1990, e o modelo do neocértex no comeco da década 
de 2000, proposto por Jeff Hawkins (nascido em 1957) e 
Dileep George (nascido em 1977). 
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Cada dendrito que envia sinais para 0 tamanho desse padrao de 
mddulo representa a presenca de um nivel infenior 


padrao de nivel inferior (ele também 
Codifica informagOes sobre tamanho). 

Um dendrito que envia sinais para fora 

do modulo indica que o padrao 
correspondente de nivel infenor @ esperado. 


Moddulo neocortical de reconhecimento de padrées 


Cada padrao (reconhecido por um identificador, numa 
estimativa de 300 milhdes de identificadores de padroes do 
neocortex) € composto de trés partes. A primeira parte 6 o 
input, que consiste nos padroes de nivel inferior que 
compoem o padrao principal. As descricdes para cada um 
desses padroes de nivel inferior nao precisam ser repetidas 
para cada padrao de nivel superior que se referencia com 


eles. Por exemplo, muitos padroes de palavras incluem a 
letra “A”. Cada um desses padroes nao precisa repetir a 
descricao da letra “A”, mas vai uSar a mesma descricao. 
Pense nele como o endereco de um site. Existe uma pagina 
da Internet (ou seja, um padrao) para a letra “A”, e todas as 
outras paginas (padroes) da Internet para palavras que 
incluem “A” terao um link com a pagina “A” (com o padrao 
“A’). Em vez de links da Internet, 0 neocdértex usa conexdes 
neurais reais. Existe um ax6nio do identificador do padrao 
“A” que se conecta com diversos dendritos, um para cada 
palavra que usa “A”. Leve em conta ainda o fator de 
redundancia: ha mais de um identificador de padrao para a 
letra “A”. Cada um desses diversos identificadores de padrao 
“A” pode mandar um sinal para os identificadores de padrao 
que incorporam “A”. 

A segunda parte de cada padrao 6 0 nome do padrao. No 
mundo da linguagem, esse padrao de nivel superior é 
simplesmente a palavra “apple” (maca). Embora usemos 
diretamente nosso neocortex para compreender e processar 
todos os niveis de linguagem, a maioria dos padroes que ela 
contém nao sao padroes de linguagem em si. No neocortex, 
o “nome” de um padrao é simplesmente o axdnio que 
emerge de cada processador de padroes; quando aquele 
axOnio dispara, seu padrao correspondente foi percebido. O 
disparo do ax6nio é o identificador de padroes gritando o 
nome do padrao: “Ei, amigos, acabei de ver a palavra escrita 


mn 


‘apple’”. 


APPLE | PEAR 


Trés padrdes redundantes (mas levemente diferentes) para “A” alimentando 
padroes de nivel superior que incorporam “A” 


A terceira e Ultima parte de cada padrao é 0 conjunto de 
padroes de nivel superior de que ele, por sua vez, faz parte. 
Para a letra “A”, ele 6 a totalidade das palavras que incluem 
“A”. MaiS uma vez, sao como links da Internet. Cada padrao 
percebido num nivel informa o nivel seguinte de que parte 
daquele padrao de nivel superior esta presente. No 
neocortex, esses links sao representados por dendritos 
fisicos que fluem para os neur6énios em cada identificador de 
padroes cortical. Leve em conta o fato de que cada neurdénio 
pode receber inputs de diversos dendritos, produzindo um 
unico output para um ax6nio. Este axdénio, porém, pode 
transmitir para diversos dendritos. 

Para usar alguns exemplos simples, os padroes simples 
da proxima pagina sao um pequeno subconjunto dos 
padroes usados para criar letras impressas. Perceba que 
cada nivel constitui um padrao. Nesse caso, as formas sao 


padroes, as letras sao padroes e as palavras também sao 
padroes. Cada um desses padroes tem um conjunto de 
inputs, um processo de reconhecimento de padroes (com 
base nos inputs que tém lugar no médulo) e um output (que 
alimenta o prdéximo nivel superior de identificagao de 
padroes). 


Conexao sudoeste ao centro do norte: 
Conexao sudeste ao centro do norte: 


Barra transversal horizontal: 


Linha vertical da extremidade esquerda: 


Concavidade voltada para o sul: é % 


Linha horizontal inferior —<=_z 


Linha horizontal superior: 


Linha horizontal do meio: 


Circuito formando a regiao superior: 


Os padroes anteriores sao os elementos constitutivos do 
proximo nivel superior de padroes, que é€ uma categoria 
chamada de letras impressas (mas nao existe tal categoria 


formal dentro do neocértex; na verdade, nao ha categorias 
formais). 
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APPLE || PEAR 
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Dois padroes diferentes, ambos constituindo o “A”, e dois padroes diferentes 
num nivel superior (“APPLE” e “PEAR”, ou pera), dos quais “A’ 6 uma parte 


“p". 
. 


Padrdes que fazem parte do padrao “P” de nivel superior 


sa hide 
. 


Padrdes que fazem parte do padrao “L’ de nivel superior/p> 


a 
. 


Padrdes que fazem parte do padrao “E” de nivel superior 


Esses padroes de letras alimentam um padrao de nivel 
ainda mais elevado, numa categoria chamada palavras. (A 
palavra “palavras” @€ nossa categoria de linguagem para 
esse conceito, mas o neocortex trata-aS apenas como 
padroes.) 


“APPLE”: 


APPLE 


AP iL 


Numa parte diferente do cdrtex, ha uma _ hierarquia 
comparavel de identificadores de padrées que processam as 
proprias imagens dos objetos (e nao das letras impressas). 
Se vocé olhar para uma maca real, identificadores de baixo 
nivel vao detectar extremidades curvas e padroées de cor da 
superficie que levam para um identificador de padroes que 
aciona seu axOnio e diz: “Ei, pessoal, acabei de ver uma 
maca de verdade”. E outros identificadores de padroes vao 
detectar combinacoes de frequéncias sonoras que levam a 
um identificador de padroes no cértex auditivo que pode 
acionar seu axdnio indicando: “Acabei de ouvir a palavra 
falada ‘maca’”. 

Tenha em mente o fator de redundancia - nao temos um 
identificador unico de padroes para a “maca” em cada uma 


de suas formas (escrita, falada, visual). E provavel que 
centenas desses identificadores estejam disparando, se nao 
mais. Nao so a redundancia aumenta a chance de 
identificarmos com sucesso cada surgimento de maca, como 
lida com as variagdes nas macas do mundo real. No caso dos 
objetos macas, havera identificadores de padroes que lidam 
com as formas mais variadas de macas: angulos, cores, 
tonalidades, formas e variedades diferentes. 

Além disso, lembre-se de que a hierarquia mostrada 
acima € uma hierarquia de conceitos. Esses identificadores 
nao se situam fisicamente uns sobre os outros; em virtude 
da pequena espessura do neocortex, ele tem a altura de 
apenas um identificador de padroes. A hierarquia conceitual 
€ criada pelas conex6ées entre os diversos identificadores de 
padroes. 

Um atributo importante da TMRP € o modo como a 
identificacao se da dentro de cada modulo de identificacao 
de padroes. Ha, nesse mddulo, um peso para cada input de 
dendrito, indicando a importancia desse input para a 
identificagcao. O identificador de padroes tem um limiar de 
disparo (que indica que esse identificador de padroes 
identificou com sucesso o padrao pelo qual ele 4 
responsavel). Nem todo padrao de jnput precisa estar 
presente para que o identificador dispare. O identificador 
pode disparar se faltar um input de pouco peso, mas é 
menos provavel que disSpare se faltar um _ impulso 
importante. Quando dispara, o identificador de padroes esta 
dizendo basicamente isto: “é provavel que o padrao pelo 
qual sou responsavel esteja presente”. 

A identificag¢ao bem-sucedida de seu padrao por um 
moddulo vai além da simples contagem dos inputs ativados 
(até numa conta na qual o parametro de importancia esta 


presente). O tamanho (de cada input) é& importante. Ha outro 
parametro (para cada input) indicando o tamanho esperado 
do input, e mais um indicando a variagao desse tamanho. 
Para entender como isso funciona, suponha que temos um 
identificador de padroes responsavel pela identificacao da 
palavra, falada em inglés, “steep” (“ingreme”, que se 
pronuncia stiip). Essa palavra falada tem quatro sons: [s], 
[t], [E] e [p]. O fonema [t] € conhecido como “consoante 
dental”, o que significa que é criado pela lingua que gera 
uma explosao de ruido quando o ar interrompe seu contato 
com os dentes superiores. E praticamente impossivel 
articular o fonema [t] lentamente. O fonema [p] é 
considerado uma “consoante plosiva”, ou “oral oclusiva”, o 
que significa que é criado quando o trato vocal é blogueado 
subitamente (pelos labios no caso do [p]), de modo que o ar 
nao passa mais por eles. Ele também é necessariamente 
rapido. A vogal [E] € causada pela ressonancia das cordas 
vocais e da boca aberta. E considerada uma “vogal longa”, 0 
que significa que persiste por um tempo muito maior do que 
consoantes como [t] e [p]; no entanto, sua duragao pode 
variar bastante. O fonema [s] 6 conhecido como “consoante 
sibilante”, sendo causado pela passagem do ar contra as 
arestas dos dentes mantidos juntos. Sua duragao costuma 
ser menor do que a de uma vogal longa como [E], mas 
também ¢é variavel (noutras palavras, o [s] pode ser 
pronunciado rapidamente, ou pode ser arrastado). 

Em nosso trabalho com o reconhecimento de _ fala, 
descobrimos que @€ necessario codificar esse tipo de 
informacao a fim de identificar padroes de fala. Por exemplo, 
as palavras “step” (“passo”) e “steep” sao muito similares. 
Embora o fonema [e] em “step” e o [E] de “steep” sejam 
vogais com sons um pouco diferentes (pelo fato de terem 


diferentes frequéncias de ressonancia), nao é€ confiavel 
distinguir essas duas palavras com base nesses sons de 
vogais, que normalmente sao confundidos. E muito mais 
confiavel considerar a observacao de que o [e] de “step” é 
relativamente breve em comparacao com o [E] de “steep”. 

Podemos codificar este tipo de informacao com dois 
numeros para cada input: o tamanho esperado e o grau de 
variabilidade desse tamanho. No exemplo do “steep”, [t] e 
[p] teriam uma breve duracgao esperada, bem como uma 
pequena variabilidade esperada (ou seja, nao esperamos 
ouvir tt e pp longos). O som [s] teria uma duracao esperada 
breve, mas uma variabilidade maior, pois é possivel arrasta- 
lo. O som [E] tem uma duracao esperada longa, bem como 
um elevado grau de variabilidade. 

Em nossos exemplos de fala, 0 parametro “tamanho” 
refere-se a duracao, mas o tempo é apenas uma dimensao 
possivel. Em nosso trabalho com o reconhecimento de 
caracteres, descobrimos que _ informacoes’- especiais 
comparaveis eram importantes a fim de identificar letras 
impressas (por exemplo, espera-se que 0 pingo sobre a letra 
“i” seja bem menor do que a porcao sob o pingo). Em niveis 
bem mais elevados de abstracao, 0 neocortex vai lidar com 
padroes com toda espécie de continuum, como niveis de 
atratividade, ironia, felicidade, frustra¢ao e milhares de 
outros. Podemos tracar semelhancas entre continua bem 
distintos, como Darwin fez ao relacionar o tamanho fisico 
dos canions geolédgicos com o grau de diferenciacao entre 
espécies. 

Num cérebro bioldgico, a fonte desses parametros 
provém da propria experiéncia do cérebro. Nao nascemos 
com um conhecimento inato de fonemas; na verdade, cada 
lingua tem conjuntos de sons bem diferentes. Isso implica 


que exemplos multiplos de um padrao sao codificados nos 
parametros aprendidos de cada identificador de padroes 
(uma vez que é preciso haver diversas ocorréncias de um 
padrao para auferir a distribuigao esperada das magnitudes 
dos inputs que chegam ao padrao). Em alguns sistemas de 
IA, parametros desses tipos sao codificados a mao por 
especialistas (por exemplo, linguistas que podem nos 
informar a duragao esperada de cada fonema, como dito 
antes). Em meu trabalho nessa area, descobrimos que fazer 
com que um sistema de IA descubra esses parametros por si 
SO a partir de dados de treinamento (tal como faz o cérebro) 
era uma abordagem preferivel. As vezes, usamos uma 
abordagem hibrida; ou seja, preparamos o sistema com a 
intuigao dos especialistas Numanos (formando- as 
configuracoes iniciais dos parametros) e depois fizemos com 
que o sistema de IA aprimorasse automaticamente essas 
estimativas usando um processo de aprendizado baseado 
em exemplos reais de fala. 

Aquilo que o mddulo de identificagao de padrées esta 
fazendo é computar a probabilidade (com base em toda sua 
experiéncia prévia) de que o padrao por cuja identificacao 
ele @ responsavel esta sendo de fato representado no 
momento por seus inputs ativos. Cada input especifico que 
vai para o modulo estara ativo se o identificador de padr6ées 
de nivel inferior correspondente estiver disparando (o que 
significa que o padrao de nivel inferior foi identificado). 
Cada input codifica ainda o tamanho observado (numa 
dimensao apropriada, como duracao, magnitude fisica ou 
outro continuum qualquer), de modo que o tamanho pode 
ser comparado pelo mdédulo (com os parametros de tamanho 
ja armazenados para cada _ input), calculando a 
probabilidade geral do padrao. 


Como o cérebro (e um sistema de IA) pode computar a 
probabilidade geral de que o padrao (que o méddulo tem a 
responsabilidade de identificar) esta presente, tendo em 
vista (1) os inputs (cada um com um tamanho observado), 
(2) oS parametros de tamanho armazenados (o tamanho 
esperado e a variabilidade de tamanho) de cada /nput e (3) 
OS parametros de importancia de cada input? Nas décadas 
de 1980 e 1990, eu e outros promovemos um método 
matematico chamado Modelos hierarquicos ocultos de 
Markov para aprender esses parametros e depois usa-los 
para identificar padrdes hierarquicos. USamos essa técnica 
para o reconhecimento da fala humana, bem como para 
compreender a_linguagem _ natural. Descrevo' mais 
detalhadamente essa abordagem no capitulo 7. 

Voltando ao fluxo de identificagcao entre um nivel de 
identificadores de padroes e o seguinte, no exemplo acima 
vemos a informacao ascendendo pela hierarquia conceitual, 
desde caracteristicas basicas das letras, passando para as 
letras e destas para as palavras. A identificagao vai 
continuar a subir dai para frases e depois para estruturas de 
linguagem mais complexas. Se subirmos por dezenas de 
niveis adicionais, chegaremos a conceitos de nivel superior, 
como ironia e inveja. Apesar de todos os identificadores de 
padroes trabalharem simultaneamente, leva algum tempo 
para que a identificag¢ao suba nessa hierarquia conceitual. A 
passagem pelos niveis leva desde alguns centésimos até 
alguns décimos de segundo para ser_ processada. 
Experimentos mostraram que um _ padrao de _ “nivel 
moderadamente elevado, como um rosto, toma um décimo 
de segundo, no minimo. Pode chegar a um segundo, caso 
haja distorcées significativas. Se o cérebro fosse sequencial 
(como os computadores convencionais) e realizasse cada 


reconhecimento de padroes em sequéncia, ele precisaria 
levar em conta todos os possiveis padroes de nivel inferior 
antes de passar para o nivel seguinte. Logo, levaria muitos 
milhdédes de ciclos s6 para subir um nivel. E exatamente o 
que acontece quando simulamos esses processos num 
computador. Mas lembre-se, porém, de que os computadores 
processam informacgoes numa velocidade milhées de vezes 
maior que a de nossos circuitos bioldgicos. 

Um ponto muito importante a se destacar aqui 6 que a 
informacao flui pela hierarquia conceitual de forma tanto 
descendente como ascendente. Com efeito, o fluxo 
descendente é até mais significativo. Se, por exemplo, 
estamos lendo da esquerda para a direita e ja vimos e 
identificamos as letras “A”, “P”, “P” e “L’, o identificador de 
“APPLE” vai prever que @€ provavel que se encontre um “E” 
Na posicao seguinte. Ele vai enviar um sinal para baixo ao 
identificador de “E”, dizendo algo como “Por favor, saiba que 
existe a grande possibilidade de que vocé veja seu padrao 
‘E’ muito em breve, por isso fique atento”. Entao, o 
identificador de “E” ajusta seu limiar de tal modo que ele 
aumenta a possibilidade de identificar um “E”. Se aparecer a 
seguir uma imagem vagamente parecida com um “E”, mas 
borrada a ponto de nao poder ser identificada como um “E” 
em circunstancias normais, o identificador de “E” pode, 
ainda assim, indicar que ele viu de fato um “E”, pois este era 
esperado. 

O neocortex, portanto, esta prevendo aquilo que espera 
encontrar. Vislumbrar o futuro € uma das principais razdes 
para termos um neocortex. No nivel conceitual mais 
elevado, estamos sempre fazendo predicoes - quem vai 
passar depois pela porta, 0 que alguém deve dizer em 
seguida, 0 que esperamos ver ao dobrar a esquina, os 


resultados mais provaveis de nossas proprias acdes e assim 
por diante. Essas predicoes acontecem sempre em todos os 
niveis da hierarquia do neocdrtex. Geralmente, deixamos de 
reconhecer pessoas, coisas e palavras porque nosso limiar 
para a confirmacao de um padrao esperado é baixo demais. 

Além de sinais positivos, ha ainda sinais negativos ou 
inibidores que indicam que é pouco provavel que exista um 
padrao determinado. Eles podem vir de niveis conceituais 
inferiores (como a identificagao de um bigode que inibe a 
probabilidade de que a pessoa que vejo na fila do caixa seja 
a minha esposa) ou de um nivel superior (sei, por exemplo, 
que minha esposa esta viajando, e por isso a pessoa na fila 
do caixa nao pode ser ela). Quando um identificador de 
padroes recebe um sinal inibidor, ele eleva o limiar de 
identificagao, mas ainda existe a possibilidade de o padrao 
disparar (de modo que se a pessoa na fila for mesmo minha 
esposa, eu ainda poderei reconhecé-la). 


A natureza dos dados que fluem para um 
ldentificador de Padroes Neocortical 


Vamos compreender melhor a aparéncia dos dados de um 
padrao. Se o padrao for um rosto, os dados existem, no 
minimo, em duas dimensdes. Nao podemos dizer que os 
olhos vém necessariamente antes, seguidos pelo nariz e 
assim por diante. O mesmo se aplica a maioria dos sons. 
Uma peca musical tem duas dimensdes, no minimo. Pode 
haver mais de um instrumento e/ou voz fazendo sons ao 
mesmo tempo. Além disso, uma unica nota de um 
instrumento complexo como o piano consiste em diversas 
frequéncias. Uma Unica voz humana consiste em diversos 


niveis de energia em dezenas de faixas de frequéncia 
simultaneamente. Por isso, um padrao sonoro pode ser 
complexo num momento qualquer, e esses momentos 
complexos se estendem no tempo. /nputs tateis também sao 
bidimensionais, pois a pele € um 6érgao bidimensional dos 
sentidos, e tais padroes podem mudar ao longo da terceira 
dimensao, o tempo. 

Logo, tem-se a impressao de que o /nput que vai para um 
processador de padroes neocortical deve abranger padroes 
bidimensionais, ou mesmo tridimensionais. No entanto, 
podemos ver na estrutura do neocdrtex que os inputs de 
padroes sao apenas listas unidimensionais. Todo o nosso 
trabalho no campo da criacgao de sistemas artificiais de 
identificag¢ao de padroes (como sistemas de reconhecimento 
visual e de fala) demonstra que podemos representar (e 
representamos) fenédmenos bidimensionais e tridimensionais 
com essas_ listas unidimensionais. Vou descrever o 
funcionamento de tais métodos no capitulo 7, mas por 
enquanto podemos seguir adiante com o entendimento de 
que o input para cada processador de padroes 6 uma lista 
unidimensional, mesmo que oO padrao em si possa refletir 
intrinsecamente mais de uma dimensao. 

Neste ponto, devemos levar em conta o insight de que os 
padroes que aprendemos a identificar (por exemplo, um cao 
especifico ou a ideia genérica de um “cao”, uma nota 
musical ou uma peca musical) sao exatamente o mesmo 
mecanismo que serve de base para nossas memorias. Na 
verdade, nossas memorias sao padroes organizados como 
listas (Sendo que cada item de cada lista é outro padrao na 
hierarquia cortical) que aprendemos e depois reconhecemos 
quando recebemos o estimulo apropriado. Com efeito, as 
memorias existem no neocdrtex para serem identificadas. 


A unica excecao a isso esta no mais baixo nivel 
conceitual possivel, em que os j/nputs de um _ padrao 
representam informacdes_ sensoriais especificas (por 
exemplo, dados de imagem provenientes do nervo 6éptico). 
Mesmo esse nivel mais baixo de padrao, porém, ja tera sido 
significativamente transformado em padroes simples antes 
de chegar ao cortex. As listas de padrées que constituem 
uma memoria estao na ordem progressiva, e SO podemos nos 
lembrar de nossas memorias nessa ordem, razao pela qual 
temos dificuldade para inverté-las. 

Uma memoria precisa ser ativada por. outro 
pensamento/memoria (estes sao a mesma coisa). Podemos 
experimentar esse mecanismo de ativagao quando 
identificamos um padrao. Quando identificamos “A”, “P”, “P” 
e “L’, o padrao “A P P L E” predisse que veriamos um “E” e 
disparou o padrao “E”, que agora é esperado. Portanto, 
nosso cortex esta “pensando” em ver um “E” antes mesmo 
que o vejamos. Se essa interacao especifica em nosso cértex 
recebe nossa atencao, vamos pensar no “E” antes de vé-lo, 
ou mesmo que nunca o vejamos. Um mecanismo similar 
aciona antigas memorias. Geralmente, ha toda uma cadeia 
desses links. Mesmo que tenhamos algum grau de 
percep¢ao das memorias (ou seja, dos padroes) que 
evocaram a memoria antiga, as Memorias (padroes) nao tem 
rétulos de linguagem ou de imagem. E por isso que 
mem6orias antigas parecem brotar repentinamente em nossa 
percepcao. Tendo ficado enterradas e inativas até por anos, 
elas precisam de um gatilho, do mesmo modo que uma 
pagina da Internet precisa de um link para ser ativada. E 
assim como uma pagina da Internet pode ficar “érfa” porque 
nenhuma pagina tem links com ela, 0 mesmo pode 
acontecer com nossas mem6orias. 


Nossos pensamentos sao, na maioria, ativados num de 
dois modos: nao direcionado e direcionado, ambos usando 
essas mesmas ligacdes corticais. No modo nao direcionado, 
permitimos que as ligagdes se formem sozinhas, sem tentar 
mové-las para alguma direcao especifica. Algumas formas 
de meditacao (como a Meditacgao Transcendental, que eu 
pratico) baseiam-se em deixar a mente fazer exatamente 
isso. Os sonhos também possuem essa qualidade. 

No pensamento direcionado, tentamos introduzir um 
processo mais organizado para evocar uma memoria (uma 
histéria, por exemplo) ou solucionar um problema. Isso 
envolve ainda o estudo de listas do neocdrtex, mas a 
agitacao menos estruturada do pensamento nao direcionado 
também vai acompanhar o processo. Portanto, 0 conteudo 
completo de nosso pensamento € bem desordenado, um 
fendmeno que James Joyce destacou em seus romances 
como “fluxo de consciéncia”. 

Quando vocé pensa nas memorias, histérias ou padroes 
de sua vida, quer envolvam um encontro casual com uma 
mae e seu bebé num carrinho durante uma caminhada, quer 
envolvam a importante narrativa sobre 0 modo como vocé 
conheceu sua esposa, suas memoéorias consistem numa 
sequéncia de padroes. Como esses padroes nao sao 
rotulados com palavras, sons, imagens ou videos, quando 
vocé tenta se recordar de um evento significativo, esta 
basicamente reconstruindo as imagens na mente, pois as 
imagens em si nao existem. 

Se féssemos “ler” a mente de alguém e espiar 
exatamente o que esta acontecendo em seu neocortex, seria 
muito dificil interpretar as memorias, quer obServassemos OS 
padroes que simplesmente estao armazenados no neocortex 
aguardando para ser diSparados, quer observassemos 


aqueles que foram disparados e que atualmente sao 
vivenciados como pensamentos ativos. Aquilo que nos 
“veriamos” seria a ativacao simultanea de milhdes de 
identificadores de padroes. Um centésimo de segundo 
depois, veriamos um conjunto diferente, formado por um 
numero comparavel de identificadores de padroes ativados. 
Cada um dos padroes seria uma lista de outros padroes, e 
cada um desses padroes seria uma lista de outros padroes, e 
assim por diante, até atingirmos os padrdes mais simples e 
elementares do nivel mais baixo. Seria extremamente dificil 
interpretar o significado desses padrées de niveis Superiores 
sem copiar efetivamente todas as informagoes em todos os 
niveiS para nosso proprio cértex. Assim, cada padrao em 
nosso neocortex sd @€ sSignificativo a luz de todas as 
informagoes carregadas nos niveis abaixo dele. Ademais, 
outros padroes no mesmo nivel e em niveis mais elevados 
também sao relevantes para a interpretacao de um padrao 
em especial, pois eles proporcionam o contexto. A 
verdadeira leitura da mente, portanto, exigiria nao apenas a 
deteccao das ativacdes dos ax6nios relevantes no cérebro de 
uma pessoa, Mas um exame de todo o seu neocdrtex, com 
todas as suas memorias, para compreender essas ativacées. 
Quando vivenciamos nossos prdéprios pensamentos e 
memorias, “sabemos” o que significam, mas eles nao 
existem como lembrangas e pensamentos prontamente 
explicaveis. Se quisermos compartilha-los com _ outras 
pessoas, sera preciso traduzi-los numa linguagem. Essa 
tarefa também é realizada pelo neocdrtex, usando 
identificadores de padroes treinados com padroes que 
aprendemos com a finalidade de usar a linguagem. A 
linguagem em si é altamente hierarquica e evoluiu para tirar 
proveito da natureza hierarquica do neocdrtex, que, por sua 


vez, reflete a natureza hierarquica da realidade. A 
Capacidade inata dos humanos para aprender as estruturas 
hierarquicas da linguagem sobre as quais Noam Chomsky 
escreveu reflete a estrutura do neocdrtex. Num trabalho 
datado de 2002 do qual foi coautor, Chomsky cita o atributo 
da “recursao” como responsavel pela singular faculdade da 
espécie humana para a linguagem [4]. Segundo Chomsky, 
recursdo 6 a Capacidade de reunir partes menores num todo 
maior, usando esse todo como parte de outra estrutura e 
continuando iterativamente com esse processo. Desse modo, 
podemos construir as complexas estruturas de frases e de 
paragrafos a partir de um conjunto limitado de palavras. 
Embora Chomsky nao estivesse se referindo explicitamente 
nesse trabalho a estrutura do cérebro, a capacidade que ele 
esta descrevendo é exatamente aquilo que 0 neocortex faz. 

Na maioria dos casos, espécies inferiores de mamiferos 
usam seu neocortex para os desafios de seu estilo de vida 
particular. A  espécie humana adquiriu capacidades 
adicionais gracas a formacao de uma _ quantidade 
substancialmente maior de cortex para lidar com a 
linguagem falada e escrita. Algumas pessoas aprenderam 
tais habilidades melhor do que outras. Se contamos uma 
histéria especifica diversas vezes, vamos, na_ verdade, 
comecar a aprender a sequéncia de linguagem que descreve 
a hist6ria como uma série de sequéncias separadas. Mesmo 
neste caso, nossa memoria nao sera uMa Sequéncia estrita 
de palavras, mas de estruturas de linguagem que 
precisaremos traduzir em sequéncias especificas de palavras 
todas as vezes que formos contar a histéria. E por isso que 
contamos uma histdéria de forma um pouco diferente cada 
vez que a compartilhamos (a menos que saibamos da 
sequéncia exata de palavras como um padrao). 


Para cada uma dessas descrico6es de processos mentais 
especificos, precisamos levar em conta a questao da 
redundancia. Como mencionei, nao temos um padrao Unico 
para representar as entidades importantes em nossas vidas, 
quer elas constituam categorias sensoriais, conceitos de 
linguagem ou memodorias de _ eventos. Cada _ padrao 
importante - em todos os niveis - é repetido muitas vezes. 
Algumas dessas_ recorréncias representam  repeticdes 
simples, enquanto muitas representam pontos de vista ou 
perspectivas diferentes. Essa 6 a principal razao pela qual 
conseguimos identificar um rosto familiar sob diversos 
angulos e varias condicdes de iluminacao. A cada nivel que 
se sobe na hierarquia, temos redundancias substanciais, 
permitindo uma variabilidade suficiente e consistente com 
esse conceito. 

Logo, se féssemos imaginar um exame de_ nosso 
neocortex enquanto estivéssemos olhando para 
determinado ente querido, veriamos uma_ grande 
quantidade de disparos dos ax6nios dos identificadores de 
padroes em todos os niveis, desde o nivel basico dos 
padroes sensoriais primitivos até muitos padr6ées diferentes 
representando a imagem desse ente querido. Também 
veriamos uma _  quantidade gigantesca de_ disparos 
representando outros aspectos da _ situagao, como os 
movimentos dessa pessoa, aquilo que ela esta dizendo e 
assim por diante. Logo, se a experiéncia parece muito mais 
rica do que uma mera viagem organizada em ascensao 
através de uma hierarquia de caracteristicas, 6 porque ela é. 

Mas 0 mecanismo basico de ascensao por uma hierarquia 
de identificadores de padroes, na qual cada nivel conceitual 
Superior representa um conceito mais abstrato e mais 
integrado, permanece valido. O fluxo de_ informacao 


descendente é€ maior ainda, pois cada nivel ativado de 
padrao identificado envia predicoes para o identificador de 
padroes seguinte no nivel inferior, dizendo o que ele pode 
encontrar a seguir. A aparente exuberancia da experiéncia 
humana resulta do fato de que todas as centenas de milhdes 
de identificadores de padrdes de nosso neocortex estao 
analisando seus /nouts ao mesmo tempo. 





Simulacao feita em computador dos disparos de muitos identificadores de 
padrdes simultaneos no neocortex 


No capitulo 5, vou discutir o fluxo de informacoes do tato, 
da visao, da audicao e de outros O6rgaos sensoriais para o 
neocortex. Esses inputs primarios sao processados por 
regides corticais dedicadas a tipos relevantes de j/nput 
sensorial (embora haja uma enorme plasticidade nas 
atribuicdes dessas regides, refletindo a uniformidade basica 


de funcao no neocortex). A hierarquia conceitual prossegue 
acima dos conceitos mais elevados em cada regiao sensorial 
do neocortex. As areas de associacgao cortical integram 
inputs dos diferentes inputs sensoriais. Quando ouvimos 
alguma coisa que pode se parecer com a voz do cénjuge, e 
vemos alguma coisa que pode indicar sua presenca, nao nos 
dedicamos a um complexo processo de deducao I|dgica; 
percebemos instantaneamente que nosso cdnjuge esta 
presente a partir da combinacgcao dessas percepcoes 
sensoriais. Integramos todas as_ pistaS sensoriais e 
perceptuais pertinentes - talvez até o cheiro de seu perfume 
ou colénia - como uma percepcao em diversos niveis. 

Num nivel conceitual acima das areas de associacao 
sensorial cortical, somos capazes de lidar (perceber, lembrar 
e pensar) com conceitos ainda mais abstratos. No nivel mais 
elevado, identificamos padroes como isto 6 engracado, ou 
ela 6 bonita, ou isto 6 irénico, e assim por diante. Nossas 
memorias incluem também esses padroes abstratos de 
identificagao. Por exemplo, podemos nos lembrar de que 
estavamos caminhando com uma pessoa e ela disse algo 
engracado, e rimos, embora nao nos lembremos da piada em 
si. A sequéncia da memoria para essa  recordacao 
simplesmente registrou a percepcao do humor, mas nao o 
conteudo exato daquilo que foi engracado. 

No capitulo anterior, comentei que geralmente podemos 
identificar um padrao mesmo que nao o reconhegamos bem 
o suficiente para podermos descrevé-lo. Por exemplo, creio 
que eu poderia identificar uma foto da mulher com o 
carrinho de bebé que vi pela manha em meio a um grupo de 
fotos de outras mulheres, apesar do fato de eu nao 
conseguir efetivamente visualiza-la e de nao poder 
descrever muitos detalhes sobre ela. Nesse caso, a 


lembrangca que tenho dela é@ uma lista de _ certas 
caracteristicas de nivel superior. Essas caracteristicas nao 
possuem rotulos de linguagem ou de imagem associados a 
elas, € nao sao imagens com pixels; assim, embora possa 
pensar nela, nao consigo descrevé-la. Mas se me 
apresentarem uma foto dela, posso processar a imagem, e 
com isso reconheco as mesmas caracteristicas de nivel 
superior que foram percebidas da primeira vez que a Vi. 
Portanto, eu seria capaz de determinar que as 
caracteristicas coincidem e escolheria a foto com confian¢a. 

Apesar de ter visto essa mulher apenas uma vez durante 
uma caminhada, € provavel que haja diversas cépias de seu 
padrao em meu neocortex. No entanto, se eu nao pensar 
nela por determinado periodo, esses identificadores de 
padr6es serao redesignados para outros padrées. E por isso 
que aS meméorias vao esmaecendo com o tempo: a 
quantidade de redundancia vai se reduzindo até essas 
memorias se extinguirem. Entretanto, agora que preservei a 
memoria dessa mulher especifica escrevendo aqui sobre ela, 
provavelmente nao me_ esquecerei dela com _ tanta 
facilidade. 


Autoassociacao e invariancia 


No capitulo anterior, discuti como identificar um padrao, 
mesmo que oO padrao total nao esteja presente, e mesmo que 
esteja distorcido. A primeira capacidade é chamada de 
autoassociacao: a habilidade de associar um padrao com 
uma parte dele mesmo. A estrutura de cada identificador de 
padroes apoia intrinsecamente essa capacidade. 

A medida que cada input de um identificador de padrées 
de nivel inferior sobe para outro de nivel mais elevado, a 


conexao pode ganhar um “peso”, indicando a importancia 
desse elemento especifico no padrao. Logo, os elementos 
mais importantes de um padrao terao um peso maior ao 
analisarmos se oO padrao deve se _ acionar como 
“identificado”. A barba de Lincoln, as costeletas de Elvisea 
famosa careta de Einstein com a lingua para fora devem ter 
um peso importante nos padroes que assimilamos sobre a 
aparéncia dessas figuras icdénicas. O identificador de 
padroes calcula a probabilidade que leva em conta os 
parametros de importancia. Logo, a probabilidade geral sera 
mais baixa se faltar um elemento ou mais, embora o limiar 
de identificagao possa ter sido atendido. Como disse, o 
calculo da probabilidade geral (de que o padrao esta 
presente) @€ mais complicado do que uma simples soma 
ponderada, pois oS parametros de tamanho também 
precisam ser considerados. 

Se o identificador de padroes recebeu um sinal de um 
identificador de nivel superior informando que seu padrao é 
“esperado”, entao o limiar 6 baixado de fato (ou seja, 4 
atingido com mais facilidade). Por outro lado, esse sinal 
pode simplesmente ser adicionado ao total de /nputs 
ponderados, compensando assim um elemento faltante. Isso 
acontece em todos os niveis, de modo que um padrao como 
um rosto que esteja varios niveis acima da base pode ser 
identificado, mesmo que faltem diversas caracteristicas. 

A habilidade de identificar padr6es mesmo quando seus 
aspectos foram transformados é chamada de invariancia de 
caracteristicas, e 6 tratada de quatro maneiras. Primeiro, ha 
transformacoes globais que sao realizadas antes que o 
neocortex receba dados sensoriais. Vamos discutir a viagem 
dos dados sensoriais desde os olhos, ouvidos e pele na secao 
“O caminho sensorial”, na pagina 122. 


O segundo método tira proveito da redundancia em 
nossa memoria cortical de padroes. Para itens importantes, 
em especial, aprendemos muitos pontos de vista e angulos 
diferentes para cada padrao. Assim, as diversas variagoes 
Sao armazenadas e processadas separadamente. 

O terceiro método, e mais poderoso, é a habilidade de 
combinar duas listas. Uma lista pode ter um conjunto de 
transformacoes que aprendemos que podem se aplicar a 
certa categoria de padrao; o cértex vai aplicar essa mesma 
lista. de mudancas possiveis noutro padrao. E assim que 
compreendemos fenémenos de linguagem como metaforas e 
comparacoes. 

Aprendemos, por exemplo, que certos fonemas (os sons 
basicos da linguagem) podem faltar na linguagem falada 
(como “vamo”). Entao, se aprendermos uma nova palavra 
falada (como “estamos”), seremos capazes de identificar 
essa palavra se um de seus fonemas estiver faltando, 
mesmo que nunca tenhamos visto essa palavra dessa forma 
antes, pois nos familiarizamos com o fendmeno geral da 
omissao de certos fonemas. Como exemplo_ adicional, 
podemos aprender que determinado artista gosta de 
enfatizar certos elementos de um rosto tornando-os maiores, 
como o nariz. Entao, podemos identificar um rosto com o 
qual estamos familiarizados ao qual foram aplicadas 
modificagdes, mesmo que nunca tenhamos visto essa 
modificagao nesse rosto. Certas modificacdes artisticas 
enfatizam as caracteristicas que nosso neocértex reconhece 
com base nos identificadores de padroes. Como disse, é 
exatamente essa a base das caricaturas. 

O quarto método deriva dos parametros de tamanho que 
permitem que um unico méddulo codifique miultiplas 
ocorréncias de um padrao. Por exemplo, ouvimos muitas 


vezes a palavra “steep”. Um méddulo especifico de 
identificag¢ao de padroes que esta reconhecendo essa 
palavra falada pode codificar esses diversos exemplos 
indicando que a duracgao de [E] tem uma elevada 
variabilidade esperada. Se todos os médulos para palavras 
que incluem [E] compartilharem um fenémeno similar, essa 
variabilidade poderia ser codificada nos modelos para o 
proprio [E]. Entretanto, palavras diferentes que incorporam 
[E] (ou varios outros fonemas) podem ter quantidades 
diferentes de variabilidade esperada. Por exemplo, é 
provavel que a palavra “peak” (“pico”) nao tenha um 
fonema [E] tao prolongado quanto na palavra “steep”. 


Aprendizado 


Nao estamos criando nossos sucessores na supremacia da Terra? 
Acrescentando algo diariamente a beleza e a delicadeza de sua 
organizacgao, dando-Ihes diariamente mais habilidade e fornecendo 
mais e mais daquele poder autorregulador e automotivador que sera 
melhor do que qualquer intelecto? 

- Samuel Butler, 1871 


As principais atividades do cérebro estado produzindo mudangas 
nelas mesmas. 
- Marvin Minsky, A sociedade da mente 


Até agora, examinamos 0 modo como identificamos padr6ées 
(sensoriais e perceptivos) e nos recordamos de sequéncias 
de padroes (nossas mem6orias de coisas, pessoas e eventos). 
Contudo, nao nascemos com um neocortex repleto de 
qualquer um desses padroes. Nosso neocortex @€ um 


territorio virgem quando o cérebro é criado. Ele tem a 
Capacidade de aprender e, portanto, de criar conexoes entre 


seus identificadores de padroes, mas conquista essas 
conex6oes a partir da experiéncia. 

Esse processo de aprendizado comeca antes mesmo de 
nascermos, ocorrendo simultaneamente com o processo 
bioldgico do crescimento do cérebro. O feto ja tem cérebro 
com um més, embora seja essencialmente um cérebro 
reptiliano, pois o feto passa efetivamente por uma recriacao 
em alta velocidade da evolucao bioldgica no utero. O 
cérebro natal € claramente um cérebro humano com 
neocdértex humano na epoca em que atinge o terceiro 
trimestre de gravidez. Nesse momento, o feto esta tendo 
experiéncias e o neocdrtex esta aprendendo. Ele pode ouvir 
sons, especialmente os batimentos cardiacos de sua mae, 
uma das possiveis razoes para que as qualidades ritmicas da 
musica sejam universais na cultura humana. Toda civilizagao 
ja descoberta teve a musica como parte de sua cultura, o 
que nao € o caso de outras formas de arte, como a pict6rica. 
Além disso, o ritmo da musica @ comparavel com nossos 
batimentos cardiacos. E claro que os ritmos musicais variam 
- do contrario, a musica nao manteria nosso interesse - mas 
os batimentos cardiacos também variam. Um batimento 
cardiaco excessivamente regular 6, na verdade, sintoma de 
um coragao doente. Os olhos de um feto abrem-se 
parcialmente 26 semanas apdos a concepcao, e ficam 
totalmente abertos na maior parte do tempo, cerca de 28 
semanas apos a concepcao. Talvez nao haja tanta coisa para 
ser vista dentro do utero, mas ha padrodes de claro e escuro 
que o neocortex comeca a processar. 

Assim, apesar de um bebé recém-nascido ter tido 
algumas experiéncias no utero, elas sao claramente 
limitadas. O neocdrtex também pode aprender com o 
cérebro primitivo (um assunto que trato no capitulo 5), mas, 


de modo geral, ao nascer, a crianga tem muito para 
aprender - tudo, desde formas e sons primitivos basicos até 
metaforas e sarcasmos. 

O aprendizado é critico para a intelig@éncia humana. Se 
fossemos modelar e simular perfeitamente o neocortex 
humano (como o Projeto Blue Brain esta tentando fazer) e 
todas as outras regides cerebrais que ele exige para 
funcionar (como o hipocampo e o talamo), ele nao 
conseguiria fazer muita coisa - assim como um bebé recém- 
nascido nao consegue fazer muita coisa (além de _ ser 
engracadinho, que é definitivamente uma _ importante 
adaptacao para a sobrevivéncia). 

Aprendizado e_ identificagao ocorrem de _ maneira 
simultanea. Comecamos a aprender imediatamente, e assim 
que aprendemos um padrao, comecamos a reconhecé-lo 
também imediatamente. O neocdrtex esta sempre tentando 
entender os inputs que lhe sao apresentados. Se um nivel 
especifico nao consegue processar e reconhecer plenamente 
um padrao, ele o envia para o prdéximo nivel superior. Se 
nenhum dos niveis conseguir identificar um padrao, ele sera 
considerado um novo padrao. Classificar um padrao como 
novo nao significa necessariamente que todos os seus 
aspectos sao novos. Se estamos olhando para os quadros de 
um determinado artista e vemos a cara de um gato com a 
tromba de um elefante, seremos capazes de identificar cada 
uma das caracteristicas distintas, mas vamos perceber que 
essa combinacao de padroes € uma coisa nova, e 
provavelmente vamos nos lembrar dela. Niveis conceituais 
superiores do neocdrtex, que compreendem contextos - por 
exemplo, a circunstancia de que esse quadro € um exemplo 
do trabalho de determinado artista e que estamos assistindo 
a apresentacao de novas obras desse artista - vao notar a 


combinagao incomum de padroes nessa cara de gato- 
elefante, mas também vao incluir esses detalhes contextuais 
como padroes de memoria adicionais. 

Novas memorias, como a cara de gato-elefante, sao 
armazenadas num identificador de padroes disponivel. O 
hipocampo é fundamental nesse processo, e vamos discutir 
O© que se conhece sobre os verdadeiros mecanismos 
bioldgicos no capitulo seguinte. No que concerne a nosso 
modelo do neocortex, basta dizer que padrées que nao sao 
identificados sao armazenados como novos padroes, sendo 
conectados apropriadamente aos padroes de nivel inferior 
que os formam. A cara do gato-elefante, por exemplo, ficara 
armazenada de diversas maneiras distintas: a disposicao 
inovadora das partes de rostos também sera armazenada, 
bem como memorias contextuais que incluem o artista, a 
situagao e talvez o fato de termos rido quando vimos a 
imagem pela primeira vez. 

Memorias identificadas com sucesso também podem 
resultar na criag¢ao de um novo padrao para obter maior 
redundancia. Se os padroes nao forem_ identificados 
perfeitamente, 6 provavel que sejam armazenados como um 
ponto de vista diferente do item que foi identificado. 

Qual, entao, € o método geral para determinar quais 
padroes sao armazenados? Em termos matematicos, o 
problema pode ser posto da seguinte maneira: usando os 
limites disponiveis de armazenamento de padroes, como 
representamos da melhor maneira possivel os padroes de 
inputs apresentados até 0 momento? Embora pareca sensato 
permitir certa dose de redundancia, nao seria pratico ocupar 
toda a area de armazenamento disponivel (ou seja, todo o 
neocortex) com padroes repetidos, pois isso nao permitiria 
uma diversidade adequada de padroes. Um padrao como o 


fonema [E] em palavras escritas 6 algo que ja encontramos 
inuUmeras vezes. E um padrao simples de _ frequéncias 
sonoras, e, sem _  duvida, desfruta de_ significativa 
redundancia em nosso neocortex. Poderiamos ocupar todo o 
neocortex com padroes repetidos do fonema [E]. No entanto, 
existe um limite para a redundancia util, e um padrao 
comum como esse claramente o atingiu. 

Existe uma solucao matematica para esse problema de 
otimizagao, chamada programacao linear, que obtém a 
melhor alocacao possivel de recursos limitados (neste caso, 
um numero limitado de identificadores de padrdoes) que 
representariam todos os casos nos quais o sistema foi 
treinado. A programacao linear destina-se a sistemas com 
inputs unidimensionais, outro motivo pelo qual é@€ bom 
representar os inputs em cada modulo de identificagao de 
padroes como uma_ série linear. Podemos usar essa 
abordagem matematica num sistema de software, e, embora 
o cérebro fisico seja limitado pelas conexdes fisicas 
disponiveis que ele pode adaptar entre identificadores de 
padroes, ainda assim 0 método é similar. 

Uma implicag¢ao importante dessa solucao otimizada é 
que experiéncias rotineiras sao identificadas, mas nao 
resultam na criagao de uma memoria permanente. Com 
relacao a minha caminhada, observei milhdes de padroes 
em todos os niveis, desde arestas e sombras visuais basicas 
até objetos como postes, caixas de correio, pessoas, plantas 
€ animais pelos quais passei. Quase nenhuma das coisas 
que observei foi Unica, e€ os padroes que _ identifiquei 
atingiram ha muito seu nivel ideal de redundancia. O 
resultado @€ que nao me lembro de quase nada dessa 
caminhada. Os poucos detalhes de que me lembro de fato 
deverdo ter sido substituidos por novos padroes apés mais 


algumas dezenas de caminhadas - exceto pelo fato de eu ter 
gravado essa caminhada em particular ao escrever sobre 
ela. 

Um ponto importante que se aplica tanto a nosso 
neocortex biol6dgico como as tentativas de imita-lo € que é 
dificil aprender muitos niveis conceituais ao mesmo tempo. 
Basicamente, podemos aprender um ou no maximo dois 
niveis conceituais de cada vez. Quando esse aprendizado 
estiver relativamente estavel, podemos passar para o nivel 
seguinte. Podemos continuar a aprimorar o aprendizado nos 
niveis inferiores, mas nosso foco de aprendizado estara no 
nivel seguinte de abstracao. Isso se aplica tanto ao comeco 
da vida, quando os recém-nascidos lidam com formas 
basicas, como a mais tarde, quando nos esforcamos para 
aprender um assunto novo, um nivel de complexidade de 
cada vez. Encontramos 0 mesmo fenémeno nas imitacdes do 
neocortex feitas em maquinas. No entanto, se introduzirmos 
materiais cada vez mais abstratos, um nivel de cada vez, as 
maquinas conseguem aprender como os humanos (embora 
ainda nao o facam com tantos niveis conceituais). 

O output de um padrao pode alimentar um padrao num 
nivel inferior ou mesmo o proprio padrao, o que da ao 
cérebro humano sua poderosa habilidade recursiva. Um 
elemento de um padrao pode ser um ponto de decisao 
baseado em outro padrao. Isso é particularmente util para 
listas que compoem acoes - por exemplo, comprar outro 
tubo de pasta de dentes caso o atual esteja vazio. Esses 
condicionantes existem em todos os niveis. Como bem sabe 
qualquer um  que_tenha_  tentado programar um 
procedimento num computador, os condicionantes sao vitais 
para descrever um caminho de acao. 


A linguagem do pensamento 


O sonho atua como uma valvula de segurancga para o cérebro 
sobrecarregado. 
- Sigmund Freud, A interpretacao dos sonhos, 1911 


Cérebro: um aparato com o qual pensamos que pensamos. 
- Ambrose Bierce, The devil’s dictionary 


Para sintetizar o que aprendemos até agora sobre 0 modo de 
funcionamento do neocdrtex, consulte o diagrama do 
modulo cortical de identificagao de padroes da pagina 62. 


a. Os dendritos entram no méddulo que representa o padrao. Embora os 
padroes possam aparentar qualidades bi ou tridimensionais, eles sao 
representados por uma sequéncia unidimensional de sinais. O padrao 
precisa ser apresentado nessa ordem (sequencial) para que o 
identificador de padrées consiga reconhecé-lo. Cada um dos dendritos 
conecta-se, em ultima analise, a um ou mais ax6nios de identificadores 
de padrées num nivel conceitual mais baixo, que identificou um padrao 
de nivel inferior que constitui parte desse padrdo. Para cada um desses 
padroes de inputs, pode haver muitos identificadores de padroes de 
nivel inferior capazes de gerar o sinal de que o padrao de nivel inferior 
foi identificado. O limiar necessario para identificar o padrao pode ser 
atingido mesmo que nem todos os inputs tenham sinalizado. O mdédulo 
calcula a probabilidade de que 0 padrao pelo qual 6 responsavel esteja 
presente. Esse calculo leva em conta os parametros de “importancia” e 
de “tamanho” (ver [f] a seguir). 

Perceba que alguns dendritos transmitem sinais para o médulo e alguns 
para fora do mddulo. Se todos os /nputs dos dendritos para esse 
identificador de padrées sinalizarem que seus padroes de nivel inferior 
foram identificados, exceto um ou dois, entao esse identificador de 
padroes vai enviar um sinal para o(s) identificador(es) de padroes 
inferiores reconhecendo os padr6oes de nivel inferior que ainda nao 
foram identificados, indicando que é bem provavel que esse padrdo seja 
reconhecido em breve e que 0(s) identificador(es) de nivel inferior 
deve(m) ficar alerta(s). 


. Quando esse identificador de padroes reconhece seu padrao (com base 
em todos ou na maioria dos sinais de /nput dos dendritos sendo 
ativados), 0 ax6nio (output) desse identificador de padrées vai se ativar. 
Este ax6nio, por sua vez, pode se conectar com toda uma rede de 
dendritos que se conecta com muitos identificadores de padr6oes de 
nivel superior para os quais esse padrao 6 um input. Esse sinal vai 
transmitir informacoes de grandeza para que os identificadores de 
padroes do nivel conceitual seguinte possam leva-lo em conta. 

. Se um identificador de padrées de nivel superior esta recebendo um 
sinal positivo de todos ou da maioria dos padroes que o constituem, 
exceto aquele representado por esse identificador de padroes, entao 
esse identificador de nivel superior pode enviar um sinal para baixo até 
esse identificador, indicando que seu padrdo 6 esperado. Esse sinal faria 
com que o identificador de padroes reduzisse seu limiar, 0 que significa 
que ele provavelmente enviaria um sinal por seu axdnio (indicando que 
se considera que seu padrao foi identificado), mesmo que faltem alguns 
inputs ou que estes nao estejam claros. 

. Sinais inibidores vindo de baixo fariam com que fosse menos provavel 
que esse identificador de padroes reconhecesse seu padrao. Isso pode 
resultar do reconhecimento de padrées de nivel inferior inconsistentes 
com o padrao associado com esse identificador de padroes (para dar um 
exemplo, a identificagdo de um bigode por um identificador de nivel 
inferior faria com que fosse menos provavel que essa imagem fosse 
“minha esposa”). 

. Sinais inibidores vindos de cima também reduzem a possibilidade de 
esse identificador de padroes reconhecer seu padrao. Isso pode ser o 
efeito de um contexto de nivel superior inconsistente com o padrao 
associado a esse identificador. 

. Para cada input, ha parametros armazenados de importancia, tamanho 
esperado e variabilidade esperada de tamanho. O méddulo calcula a 
probabilidade geral de que o padrao esteja presente com base em todos 
esses parametros e os sinais atuais indicando quais dos inputs estao 
presentes e quais sao suas magnitudes. Um modo matematicamente 
ideal para fazer isso emprega uma técnica chamada Modelos ocultos de 
Markov. Quando tais modelos sao organizados numa hierarquia (tal 
como no neocortex ou em tentativas de simular um neocortex), 
chamamo-los Modelos hierarquicos ocultos de Markov. 


Padroes ativados no neocértex ativam outros padroées. 
Padroes parcialmente completos enviam sinais que descem 
pela hierarquia conceitual; padroes completos enviam sinais 
que sobem pela hierarquia conceitual. Esses padroes 
neocorticais sao a linguagem do pensamento. Assim como a 
linguagem, eles sao hierarquicos, mas nao sao a linguagem 
em si. Nossos pensamentos nao sao_ concebidos 
primeiramente por elementos de linguagem, apesar do fato 
de que, como a linguagem também existe como hierarquias 
de padroes em nosso neocortex, podemos ter pensamentos 
baseados na linguagem. Em sua maioria, porém, os 
pensamentos  sdo representados nesses padroes 
neocorticais. 

Como disse antes, se pudéssemos detectar as ativacoes 
de padrdoes do neocortex de alguém, teriamos pouca nocao 
do significado dessas ativacdes se nao tivéssemos acesso a 
toda a hierarquia de padr6oes acima e abaixo de cada padrao 
ativado. Para isso, seria preciso ter acesso a todo o 
neocortex dessa pessoa. Ja é dificil compreender o conteudo 
de nossos prdéprios pensamentos; compreender o de outras 
pessoas exige que dominemos um neocortex diferente do 
nosso. Naturalmente, nao temos ainda acesso ao neocortex 
de outra pessoa; precisamos, portanto, confiar em sua 
tentativa de expressar seuS pensamentos por meio da 
linguagem (e por outros meios, como os gestos). Como as 
pessoas nao t@ém uma Capacidade completa de realizar essas 
tarefas de comunicacao, adiciona-se outra camada de 
complexidade - desse modo, nao é a toa que nos 
entendemos tao mal. 

Temos dois modos de pensar. Um deles € 0 pensamento 
nao direcionado, em que os pensamentos se ativam 
mutuamente, de forma nao_ Ildgica. Quando surge 


subitamente uma lembranca de anos ou décadas atras 
enquanto estamos fazendo alguma coisa, como varrer a 
calcada ou caminhar pela rua, a experi@ncia € recordada - 
como todas as memorias - como uma sequéncia de padroées. 
Nao visualizamos imediatamente a cena, a menos que 
possamos evocar varias outras memorias que nos permitam 
sintetizar uma lembranca mais robusta. Se visualizarmos a 
cena desse modo, nés a estaremos criando em nossa mente 
com pistas provenientes da época da recordacao; a memoria 
em si nao fica armazenada na forma de imagens ou de 
visualizagoes. Como disse antes, os_ gatilhos que 
desencadeiam esse pensamento na nossa mente podem ou 
nao ser evidentes. A sequéncia de pensamentos relevantes 
pode ter sido esquecida imediatamente. Mesmo que a 
lembremos, ela sera uma sequéncia nao linear e sinuosa de 
associacoes. 

O segundo modo de pensar 6 0 pensamento direcionado, 
que usamos quando tentamos solucionar um problema ou 
formular uma resposta organizada. Por exemplo, podemos 
ensaiar mentalmente alguma coisa que planejamos dizer 
para alguém, ou podemos formular um trecho que 
desejamos escrever (quem sabe, num livro sobre a mente). 
Quando pensamos em tarefas como essas, ja as dividimos 
numa hierarquia de subtarefas. Escrever um livro, por 
exemplo, implica escrever capitulos; cada capitulo tem 
secdes; cada secao tem paragrafos; cada paragrafo contém 
frases que expressam ideias; cada ideia tem _ sua 
configuragao de elementos; cada elemento e cada relacao 
entre elementos € uma ideia que precisa ser articulada; e 
assim por diante. Ao mesmo tempo, nossas_ estruturas 
neocorticais aprenderam certas regras que devem ser 
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seguidas. Se a tarefa é€ escrever, entao devemos tentar 


evitar repeticdes desnecessarias; deveriamos nos assegurar 
de que o leitor consegue acompanhar o que esta sendo 
escrito; deveriamos tentar seguir as regras gramaticais e de 
estilo; e@ assim por diante. Portanto, o escritor precisa 
construir um modelo do leitor em sua mente, e essa 
construcao também sera hierarquica. QUando pensamos de 
forma direcionada, estamos percorrendo listas no neocértex, 
e cada uma se expande em amplas hierarquias de sublistas, 
cada uma com suas proprias consideracées. Lembre-se de 
que os elementos de uma lista de um padrao neocortical 
podem _ incluir condicionantes, de modo que nossos 
pensamentos e acoes subsequentes vao depender de 
avaliacoes feitas enquanto passamos pelo processo. 

Além disso, cada um desses pensamentos direcionados 
vai acionar hierarquias de pensamentos nao direcionados. 
Uma tempestade constante de elucubracgdes cai sobre 
nossas experiéncias sensoriais e nossas tentativas de pensar 
de modo direcionado. Nossa experiéncia mental efetiva é 
complexa e confusa, constituida por essas tempestades de 
raios de padroes acionados, que mudam cerca de cem vezes 
por segundo. 


A linguagem dos sonhos 


Os sonhos sao exemplos de pensamentos nao direcionados. 
Eles fazem certo sentido, pois o fenédmeno pelo qual um 
pensamento aciona outro baseia-se nos vinculos efetivos 
entre padroes em nosso neocortex. Quando um sonho nao 
faz sentido, tentamos corrigi-lo com nossa capacidade de 
confabular. Como vou descrever no capitulo 9, pacientes 
com cérebros partidos (cujo corpo caloso, que une os dois 
hemisférios cerebrais, foi danificado ou  seccionado) 


confabulam (inventam) explicagdes com o_ hemisfério 
esquerdo - que controla o centro da fala - para explicar o 
que o hemisfério direito acabou de fazer com um input ao 
qual o hemisfério esquerdo nao teve acesso. Confabulamos o 
tempo todo quando explicamos o resultado de eventos. Se 
quiser um bom exemplo disso, ligue a tevé no comentario 
diario sobre o movimento dos mercados financeiros. 
Qualquer que seja o desempenho do mercado, é€ sempre 
possivel encontrar uma boa explicacao para o que 
aconteceu, e esses comentarios pds-fato sao abundantes. 
Naturalmente, se esses comentaristas compreendessem de 
fato oS mercados, nao teriam de perder seu tempo fazendo 
comentarios. 

O ato de confabular, obviamente, também é feito no 
neocortex, que é habil para descobrir histdérias e explicacdes 
que atendam a determinadas limitagcoes. Fazemos isso 
sempre que contamos uma histoéria. Para que a historia faca 
mais sentido, acrescentamos detalhes que talvez nao 
estejam disponiveis ou que tenhamos esquecido. E por isso 
que as histérias mudam com o tempo ao serem contadas 
repetidas vezes por novos contadores, que podem ter visoes 
ou posicoes diferentes. Quando a linguagem falada levou a 
linguagem escrita, porém, conseguimos uma tecnologia que 
pdde registrar uma versao definitiva da histdria, impedindo 
esse tipo de variacao. 

O conteudo efetivo de um sonho, até o ponto em que nos 
lembramos dele, também é uma sequéncia de padroes. 
Esses padroes representam limitagcées numa hist6ria; depois, 
confabulamos uma_ histéria que se encaixa nessas 
limitagoes. A versao do sonho que tornamos a contar 
(mesmo que o fagamos para nés mesmos, em siléncio) é 
essa confabulacao. Quando narramos novamente um sonho, 


acionamos cascatas de padroes que se encaixam no sonho 
real, tal como o experimentamos originalmente. 

Existe uma diferenca importante entre os pensamentos 
que temos nos sonhos e aquilo em que pensamos enquanto 
estamos acordados. Uma das licOes que aprendemos na vida 
€ que certas acdes, até mesmo pensamentos, nao sao 
possiveis no mundo real. Aprendemos, por exemplo, que nao 
podemos satisfazer imediatamente nossos desejos. Ha 
regras contra pegar o dinheiro do caixa de uma loja, e ha 
limitagoes na interag¢ao com uma pessoa pela qual sentimos 
atracao fisica. Também aprendemos que certos pensamentos 
nao sao permitidos porque sao proibidos por nossa cultura. 
Quando desenvolvemos nossos_ talentos profissionais, 
aprendemos os modos de pensar que sao aceitos e 
recompensados em nossa profissao, e assim evitamos 
padroes de pensamento que podem trair os métodos e as 
normas dessa profissao. Muitos desses tabus sao validos, 
pois impdem a ordem social e consolidam o progresso. No 
entanto, também podem impedir o progresso por imporem 
uma ortodoxia improdutiva. Foi exatamente essa ortodoxia 
que Einstein deixou para tras ao tentar cavalgar um feixe de 
luz em seus experimentos mentais. 

As regras culturais sao postas em pratica no neocdrtex 
com a ajuda do cérebro primitivo, especialmente a 
amigdala. Todo pensamento que temos provoca outros 
pensamentos, e alguns deles estarao relacionados com 
certos perigos. Aprendemos, por exemplo, que romper uma 
norma cultural, mesmo em nossos pensamentos intimos, 
pode nos levar ao ostracismo, que o neocortex percebe 
como uma ameaca ao nosso bem-estar. Se temos 
pensamentos desse tipo, a amigdala 6 acionada e isso gera 
medo, 0 que acaba levando ao fim desse pensamento. 


Nos sonhos, porém, os tabus sao relaxados, e geralmente 
sonhamos com assuntos que sao proibidos em termos 
culturais, sexuais ou profissionais. E como se o cérebro 
percebesse que enquanto sonhamos nao estamos agindo no 
mundo. Freud escreveu sobre esse fendmeno, mas também 
observou que vamos disfarcar tais pensamentos perigosos, 
pelo menos quando tentamos recorda-los, para que o 
cérebro em vigilia continue protegido deles. 

Abrandar os tabus profissionais pode ser Util para a 
solucao criativa de problemas. Uso uma técnica mental 
todas as noites em que penso num determinado problema 
antes de dormir. Ela aciona sequéncias de pensamentos que 
vao continuar nos meus sonhos. Assim que. estiver 
sonhando, posso pensar - sonhar - com solucdoes para oO 
problema sem o fardo das limitac6es profissionais que me 
acompanham durante o dia. Entao, posso ter acesso a esses 
pensamentos oniricos de manha, enquanto ainda me acho 
no estado intermediario entre o sonho e a vigilia, algo que 
alguns chamam de “sonho lucido [5]”. 

Freud também ficou famoso por escrever sobre a 
possibilidade de conseguir entender a psicologia de uma 
pessoa interpretando seus sonhos. Naturalmente, é vasta a 
literatura sobre todos os aspectos dessa teoria, mas o 
conceito fundamental de obter um insight sobre nds mesmos 
mediante o exame de nossos sonhos faz sentido. Nossos 
sonhos sao criados pelo neocortex, e por isso sua substancia 
pode revelar o conteudo e as conexoes encontradas la. O 
relaxamento das limitagcoOes de nossos pensamentos, que 
existem enquanto estamos acordados, também é util para 
revelar conteUdos neocorticais que, do contrario, nao 
conseguirfiamos acessar diretamente. Também é€ razoavel 
concluir que os padroes que acabam surgindo em nossos 


sonhos representam questées importantes para nds, sendo 
por isso pistaS para compreendermos nossos desejos e 
medos nao resolvidos. 


As raizes do modelo 


Como mencionei antes, nas décadas de 1980 e 1990 liderei 
uma equipe que desenvolveu a técnica dos modelos 
hierarquicos ocultos de Markov para identificar a fala 
humana e compreender frases em linguagem natural. Esse 
trabalho foi o antecessor dos atuais sistemas comerciais 
amplamente utilizados para o reconhecimento e a 
compreensao daquilo que tentamos Ihes dizer (sistemas de 
navegacao para carros com os quais € possivel conversar, 
Siri no iPhone, Google Voice Search e muitos outros). A 
técnica que desenvolvemos tinha basicamente todos os 
atributos que descrevo no TMRP. Ela inclui uma hierarquia 
de padroes, na qual cada nivel mais elevado 64 
conceitualmente mais abstrato do que aquele situado 
abaixo dele. Por exemplo, no reconhecimento de fala os 
niveis inclufam padrédes basicos de frequéncia sonora no 
nivel mais baixo, depois fonemas, depois palavras e frases 
(que volta e meia eram identificadas como sendo palavras). 
Alguns de nossos sistemas de reconhecimento de fala 
poderiam compreender o significado de comandos de 
linguagem natural, e por isso niveiS ainda mais elevados 
inclufam estruturas como frases com substantivos e verbos. 
Cada modulo de identificacao de padroes podia identificar 
uma sequéncia linear de padrdoes a partir de um nivel 
conceitual inferior. Cada input tinha parametros relativos a 
importancia, ao tamanho e a variabilidade de tamanho. 
Havia sinais “descendentes” indicando que era esperado um 


padrao de nivel inferior. Trato dessa pesquisa com mais 
detalhes no capitulo 7. 

Em 2003 e 2004, o inventor do PalmPilot, Jeff Hawkins, e 
Dileep George desenvolveram um _ modelo cortical 
hierarquico chamado memoria temporal hierarquica. Com 
Sandra Blakeslee, autora de livros sobre ciéncia, Hawkins 
descreveu esse modelo de forma eloquente em seu livro On 
intelligence. Hawkins defende com vigor a uniformidade do 
algoritmo cortical e sua organizacao hierarquica e baseada 
em listas. Ha algumas diferengcas importantes entre o 
modelo apresentado em On intelligence e aquilo que 
apresento neste livro. Como o nome implica, Hawkins esta 
enfatizando a natureza temporal (baseada no tempo) das 
listas constitutivas. Noutras palavras, a direcao das listas 
sempre avanca no tempo. Sua explica¢ao para o modo como 
as Caracteristicas de um padrao bidimensional como a letra 
impressa “A” t€ém uma direcao no tempo baseia-se no 
movimento do olho. Ele explica que visualizamos imagens 
usando sacadas, que sao movimentos oculares muito 
rapidos e imperceptiveis. A informacao que chega ao 
neocortex, portanto, nao € um conjunto bidimensional de 
caracteristicas, mas uma lista organizada no tempo. Embora 
seja fato que nossos olhos realmente fazem movimentos 
muito rapidos, a sequéncia na qual eles veem as 
caracteristicas de um padrao como a letra “A” nem sempre 
ocorre numa ordem temporal consistente. (Para dar um 
exemplo, aS sacadas oculares nem sempre registram o 
vertice superior do “A” antes de sua concavidade inferior.) 
Além disso, podemos_ identificar um  padrao_ visual 
apresentado apenas durante algumas dezenas_ de 
milissegundos, um periodo de tempo pequeno demais para 
que as sacadas oculares o observem. E fato que os 


identificadores de padroes armazenam um padrao como 
uma lista e que a lista 6 realmente organizada, mas a ordem 
nao representa necessariamente o tempo. Geralmente, é 
esse oO caso, mas ele pode representar também uma 
organizacao espacial ou conceitual de nivel superior, como 
disse antes. 

A diferenca mais importante é 0 conjunto de parametros 
que inclui para cada input do mdédulo de identificagao de 
padroes, especialmente os parametros de tamanho e de 
variabilidade de tamanho. Na década de 1980, chegamos a 
tentar reconhecer a voz humana sem esse tipo de 
informacgao. Isso foi motivado por linguistas que nos 
disseram que a_informacao da duracao nao era 
especialmente importante. Essa perspectiva é ilustrada por 
dicionarios que escrevem a pronuncia de cada palavra como 
uma série de fonemas, como por exemplo a palavra “steep” 
como [s] [t] [E] [p], sem a indicagao do tempo que se espera 
que cada fonema dure. A implicagcao €@ que se criamos 
programas para identificar fonemas e entao encontramos 
esta sequéncia especifica de quatro fonemas (de forma 
falada), deveriamos poder identificar essa palavra falada. O 
sistema que construimos usando esse método funcionou até 
certo ponto, mas nao o suficiente para lidar com atributos 
como um vocabulario extenso, diversos falantes e palavras 
faladas continuamente, sem pausas. Quando usamos a 
técnica dos modelos hierarquicos ocultos de Markov para 
incorporar a distribuigao da grandeza de cada input, o 
desempenho melhorou muito. 


¢ Capitulo 4 « 


O neocortex biolégico 


Assim como as coisas importantes tem uma caixa que as contém, 

nos temos o cranio para o cérebro, um estojo de plastico para o 
pente e uma carteira para o dinheiro. 

- George Costanza, 

no episddio “The Reverse Peephole” de Seinfeld 


Agora, pela primeira vez, estamos observando o cérebro em 
funcionamento de maneira global e com tanta clareza que 
deverfamos poder descobrir os programas gerais por tras de seus 
poderes magnificos. 

- J. G. Taylor, B. Horwitz e K. J. Friston 


A mente, em suma, trabalha com os dados que recebe de forma 
similar ao escultor com um bloco de pedra. De certo modo, a 
estatua estava la desde a eternidade. Mas havia mil outras 
diferentes além dela, e s6 o escultor merece elogios por ter 
arrancado essa dentre as demais. Assim 6 0 mundo de cada um de 
nos e, por mais que sejam diferentes nossas opinides a seu respeito, 
todos estao embutidos no caos primordial de sensagdes que 
forneceu com indiferenca a mera matéria para 0 pensamento de 
cada um. Podemos, caso desejemos, retroagir com nossos 
raciocinios até aquela continuidade escura e indistinta de espaco, 
com nuvens moveis de atomos pululantes que a ciéncia chama de 
Unico mundo real. Mas nesse tempo todo o mundo que nods 
sentimos e no qual vivemos sera esse que nossos ancestrais e nos, 


gracas a escolhas lentamente cumulativas, arrancamos disso, como 
escultores, gracas a simples rejeicao de certas porcdes do que nos 
foi dado. Outros escultores, outras estatuas da mesma _ pedra! 
Outras mentes, outros mundos do mesmo monotono e inexpressivo 
caos! Meu mundo é apenas um num milhao de mundos igualmente 
embutidos, igualmente reais para quem possa abstrai-los. Quao 
diferentes devem ser os mundos nas consciéncias da formiga, da 
lula ou do caranguejo! 

- William James 


era a inteligéncia a meta, ou mesmo uma meta, da 
S evolucao bioldgica? Steven Pinker escreveu: “Somos 
chauvinistas com relacao ao nosso cérebro, pensando que é 
a meta da evolucao [1]”, e prossegue dizendo que “isso nao 
faz sentido [...] A selecao natural nao faz nada que sequer se 
aproxime da busca pela intelig@éncia. O processo é motivado 
por diferencas nos indices de sobrevivéncia e de reproducao 
dos organismos que se _ reproduzem num _= ambiente 
especifico. Com o tempo, os organismos adquirem desenhos 
que os adaptam para a sobrevivéncia e a reproducao nesse 
ambiente, ponto final; nada os atrai para qualquer direcao 
além do sucesso naquele lugar e naquele momento”. Pinker 
conclui que a “vida € um arbusto densamente ramificado, 
nao um degrau ou uma escada, € Os organismos vivos estao 
na ponta dos ramos, nao nos galhos inferiores”. 

Com relag¢ao ao cérebro humano, ele questiona se “os 
beneficios superam os custos”. Entre os custos, ele 
menciona que “o cérebro [é] volumoso. A pelve feminina mal 
acomoda a cabeca desproporcional do bebé. Esse desenho 
problematico mata muitas mulheres no parto e exige um 
modo de andar pivotado que torna as mulheres menos 
Capazes de caminhar do que os homens, em termos 
biomecanicos. Além disso, uma cabeca pesada balancando 


num pescoco torna-nos mais vulneraveis a ferimentos fatais 
em acidentes, como nas _ quedas”. Ele prossegue 
relacionando' vulnerabilidades adicionais, inclusive o 
consumo de energia do cérebro, seu tempo lento de reacao e 
o extenso processo de aprendizado. 

Neocortex 

O neocdrtex cobre todo 0 cérebro com sua 


superficie fina e convoluta e esta dividido em 
duas metades, ligadas pelo compo caloso 





Area sensorio-motora 





Distribuicao fisica das principais regides do cérebro 


Embora cada uma dessas afirmacdes seja precisa a 
primeira vista (apesar de muitas de minhas amigas 
caminharem melhor do que eu), Pinker nao percebeu a 
questéo mais ampla em jogo. E fato que, em termos 
biolégicos, a evolucao nao tem uma direcao especifica. E um 


método de procura que efetivamente preenche por completo 
o “arbusto densamente ramificado” da natureza. Também é 
fato que aS mudancas evolutivas nao se movem 
necessariamente na dire¢ao de uma inteligéncia maior - 
elas se movem em todas as direcoes. Sao muitos os 
exemplos de criaturas bem-sucedidas que se mantiveram 
relativamente imutaveis durante milhdes de anos. (Os 
jacarés, por exemplo, datam de 200 milhées de anos, e 
muitos micro-organismos sao muito mais antigos do que 
isso.) Mas no processo de preencher completamente 
milhares de ramos evolutivos, uma das diregcoes nas quais 
elas se movem @€ a da inteligéncia maior. Este € o ponto 
relevante para os propésitos desta discussao. 

Suponha que tenhamos um gas azul num jarro. Quando 
tiramos a tampa, nao aparece uma mensagem distribuida 
para todas as moléculas do gas, dizendo: “Ei, amigos, o jarro 
esta sem tampa; vamos até a abertura e Saiamos para a 
liberdade”. As moléculas ficam fazendo exatamente o que 
sempre fazem, que é€ mover-se para todos os lados sem 
direg¢ao aparente. Mas, enquanto o fazem, aquelas mais 
proximas da boca vao acabar saindo do jarro, e, com o 
tempo, a maioria vai fazer a mesma coisa. Quando a 
evolucao biolégica encontrou um mecanismo nervoso capaz 
de aprendizado hierarquico, viu que ele era imensamente 
util para um objetivo da evolucao, que é a sobrevivéncia. O 
beneficio de ter um neocortex tornou-se critico quando 
circunstancias que mudavam depressa favoreceram um 
aprendizado rapido. Espécimes de todos os tipos - plantas e 
animais - podem aprender a se adaptar a circunstancias 
mutaveis ao longo do tempo, mas, sem um neocortex, elas 
precisam usar o processo da evolucao genética. Pode levar 
muitas geracdes - milhares de anos - até uma espécie sem 


neocortex aprender comportamentos novos e significativos 
(ou, No caso das plantas, outras estratégias de adaptacdo). A 
evidente vantagem para a sobrevivéncia do neocértex foi a 
possibilidade de aprender numa questao de dias. Se uma 
especie se defronta com circunstancias drasticamente 
diferentes e um membro dessa espécie inventa, descobre ou 
simplesmente depara com (esses trés métodos sao variacées 
da inovagao) um modo de se adaptar a essa mudanca, 
outros individuos vao notar, aprender e copiar esse método, 
e€ em pouco tempo ele se espalhara rapidamente, como um 
virus, para toda a populacao. A extin¢ao cataclismica no 
periodo Cretaceo-Paleogeno, cerca de 65 milhdes de anos 
atras, levou ao rapido desaparecimento de muitas espécies 
que nao possuiam neocdrtex e que nao conseguiram se 
adaptar com a velocidade suficiente a um ambiente alterado 
de repente. Isso assinalou um ponto de inflexao, em que 
mamiferos capazes de utilizar o neocértex assumiram seu 
nicho ecolégico. Desse modo, a evolucao biolégica percebeu 
que o aprendizado hierarquico do neocortex era tao valioso 
que essa regiao do cérebro continuou a aumentar de 
tamanho até ocupar virtualmente o cérebro do Homo 
sapiens. 
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O neocortex nos diferentes mamiferos 


Descobertas da neurociéncia determinaram de forma 
convincente o papel crucial da capacidade hierarquica do 
neocortex, além de apresentarem evidéncias para a teoria 
da mente baseada em reconhecimento de padroes (TMRP). 
Essas evidéncias estao distribuidas em muitas observacées 
e analises, e vou discutir algumas delas aqui. O psicdélogo 
canadense Donald O. Hebb (1904-1985) fez uma tentativa 
inicial para explicar a base neurolégica do aprendizado. Em 
1949, ele descreveu um mecanismo segundo o qual os 
neurdénios mudam fisiologicamente com base em suas 
experiéncias, proporcionando assim uma base para o 
aprendizado e a plasticidade do cérebro: “Vamos presumir 
que a persisténcia ou a repeti¢ao de uma atividade 


reverberatoria (ou ‘traco’) tende a induzir mudancas 
celulares duradouras que aumentam sua _ estabilidade... 
Quando um axénio da célula A esta prdéximo o suficiente 
para excitar uma célula B, e participa repetida ou 
persistentemente de sua ativacao, ocorre algum processo de 
crescimento ou uma mudanca metabdlica em uma ou ambas 
as células, de modo que a eficiéncia de A, como uma das 
células que ativa B, aumenta _[2]”. Essa _ teoria foi 
apresentada como “células que se ativam juntas ficam 
juntas”, e ficou conhecida como aprendizado hebbiano. 
Aspectos da teoria de Hebb foram confirmados, pois esta 
claro que combinacoes cerebrais podem criar novas 
conex6es e fortalecé-las, com base em sua propria atividade. 
Podemos de fato ver neurdnios desenvolvendo essas 
conexoes em varreduras cerebrais. “Redes neurais” artificiais 
baseiam-se no modelo de Hebb do aprendizado neuronal. 

A suposicao central da teoria de Hebb é que a unidade 
basica de aprendizado do neocortex é o neurénio. A teoria 
da mente baseada em reconhecimento de padroes que 
apresento neste livro baseia-se numa unidade fundamental 
diferente: nao o neurdénio em si, mas um conjunto de 
neurdnios, que estimo que sejam da ordem de uma centena. 
As conexoes e a forca sinaptica dentro de cada unidade sao 
relativamente estaveis e determinadas geneticamente; ou 
seja, a organizacao de cada mddulo de identificacao de 
padroes @ determinada por designio genético. O 
aprendizado ocorre na criagao de conexoes entre essas 
unidades, nao dentro delas, e provavelmente na_ forca 
sinaptica dessas conex6ées entre unidades. 

Um apoio recente para o fato de o méddulo basico de 
aprendizado ser um mddulo de dezenas de neurénios vem 
do neurocientista suico Henry Markram (nascido em 1962), 


Cujo ambicioso Projeto Blue Brain para simular todo o 
cérebro humano esta descrito no capitulo 7. Num texto de 
2011, ele descreve como, ao fazer a varredura e a analise de 


xX 


neurdénios do neocdrtex de mamiferos, ele ficou a “procura 
de evidéncias de conjuntos hebbianos no nivel mais 
elementar do cértex”. O que ele descobriu no lugar disso, 
segundo escreve, foram “conjuntos fugazes _ [cuja] 
conectividade e peso sinaptico sao altamente previsiveis e 
limitados”. Ele concluiu que “essas descobertas implicam 
que a experiéncia nao pode moldar facilmente as conexdes 
sinapticas desses conjuntos” e especula que “eles servem 
de blocos de construcao inatos, como se fossem Lego, de 
conhecimento da percepcao, e que a aquisi¢ao de memorias 
envolve a combinacgao desses blocos de constru¢ao em 
construtos complexos”. E prossegue: 


Conjuntos neuronais funcionais tém sido relatados ha décadas, mas 
as evidéncias diretas de agrupamentos de neurdénios conectados 
sinapticamente [...] nao estavam disponiveis [...]. Como todos esses 
conjuntos serao similares em topologia e em peso sinaptico, nao 
sendo moldados por nenhuma experiéncia especifica, consideramo- 
los conjuntos inatos [...]. A experiéncia tem um pequeno papel na 
determinacao de conexées sinapticas e pesos nesses conjuntos [...]. 
Nosso estudo encontrou evidéncias [de] conjuntos inatos, como se 
fossem de Lego, com apenas algumas dezenas de neurdonios [...]. As 
conexdes entre conjuntos podem combina-los em superconjuntos 
numa camada neocortical, depois em conjuntos de ordem superior 
numa coluna cortical, em conjuntos de ordem ainda mais elevada 
numa regiao cerebral, e finalmente no conjunto da mais elevada 
ordem possivel, representado pelo cérebro todo [...]. Adquirir 
memorias € bem similar a construir com Lego. Cada montagem 
equivale a um bloco de Lego que contém um pedaco de 
conhecimento inato e elementar sobre como processar, perceber e 
reagir ao mundo [...] Quando blocos diferentes se juntam, formam, 
portanto, uma combinacao unica dessas percepcdes inatas, 


representando o conhecimento e a experiéncia especifica de um 
individuo [3]. 


Os “blocos de Lego” que Markram propoe sao plenamente 
consistentes com os mddulos de identificacao de padroes 
que descrevi. Numa comunicagao por e-mail, Markram 
descreveu esses “blocos de Lego” como “conteudo 
compartilhado e conhecimento _inato [4]”. Eu diria que o 
proposito desses mddulos é identificar padrdes, recorda-los e 
prevé-los com base em padroées parciais. Note-se que a 
estimativa de Markram para cada méddulo, que conteria 
“varias dezenas de neurénios”, baseia-se apenas na camada 
V do neocértex. De fato, a camada V 6 rica em neurénios, 
mas, com base na proporcao habitual de contagem de 
neurénios nas seis camadas, isso daria uma ordem de 
grandeza de uns cem neurdénios por méddulo, algo 
consistente com minhas estimativas. 

As conex6oes consistentes e a modularidade aparente do 
neocortex tém sido notadas ha muitos anos, mas este estudo 
€ o primeiro a demonstrar a estabilidade desses mddulos 
quando o cérebro se submete a seus processos dinamicos. 

Outro estudo recente, este do Massachusetts General 
Hospital, financiado pelo National Institutes of Health e pela 
National Science Foundation, e publicado na edicao de 
marco de 2012 da revista Science, também mostra uma 
estrutura regular de conexées através do neocortex [5]. O 
artigo descreve como as conex6ées do neocértex seguem um 
padrao de grade, como as ruas de uma cidade projetada: 
“Basicamente, a estrutura geral do cérebro acaba se 
assemelhando a Manhattan, onde temos um plano em 2D 
das ruas e um terceiro eixo, um elevador que sobe na 


terceira dimensao”, escreveu Van J. Wedeen, neurocientista 
e fisico de Harvard e chefe desse estudo. 

Num podcast da revista Science, Wedeen descreveu a 
importancia da pesquisa: “Esta foi uma investigacgao da 
estrutura tridimensional dos caminhos do cérebro. Quando 
os cientistas comecaram a pensar nos caminhos do cérebro, 
ha uns cem anos, aproximadamente, a imagem ou 0 modelo 
tipico que vem a mente @€ que esses caminhos podem se 
assemelhar a um prato de espaguete - caminhos separados 
que tém poucos padroes espaciais especificos em relacao 
uns com os outros. Usando imagens de_ressonancia 
magnética, pudemos investigar experimentalmente essa 
questao. E o que descobrimos € que, em vez de serem 
Caminhos dispostos ao acaso ou de forma independente, 
todos os caminhos do cérebro reunidos se ajustam numa 
unica estrutura, extremamente simples. Basicamente, 
parecem-se com um cubo. Eles seguem trés direcoes 
perpendiculares, e em cada uma dessas trés direcdes os 
caminhos sao bem paralelos uns com os outros, dispostos 
em matrizes. Assim, em vez de fios de espaguete 
independentes, vemos que a conectividade do cérebro é, de 
certo modo, uma Unica estrutura coerente”. 

Enquanto o estudo de Markram mostra um méddulo de 
neur6nios que se repete através do neocortex, o estudo de 
Wedeen demonstra um padrao notavelmente organizado de 
conexées entre mddulos. O cérebro comeca com um grande 
numero de “conexdes em espera” as quais os mddulos de 
identificag¢ao de padroes podem se conectar. Assim, se um 
determinado mddulo deseja se conectar com outro, ele nao 
precisa fazer crescer um axOnio num deles e um dendrito no 
outro para cobrir toda a distancia fisica entre eles. Ele pode 
simplesmente tomar uma dessas conexodes de axdnios “em 


espera” e ligar-se as extremidades da fibra. Como escrevem 
Wedeen e seus colegas, “os caminhos do cérebro seguem 
um plano basico estabelecido pela [...] embriogénese 
primordial. Logo, os caminhos do _ cérebro maduro 
apresentam uma imagem desses trés gradientes primitivos, 
deformados fisicamente pelo desenvolvimento”. Noutras 
palavras, a medida que aprendemos e temos experiéncias, 
os mddulos de identificacao de padrées do neocdrtex vao se 
conectando a essas conexoes preestabelecidas que foram 
criadas quando éramos embrides. 

Existe um tipo de chip eletrénico chamado Arranjo de 
Portas Programavel em Campo (com sigla em inglés FPGA) 
que se baseia num principio similar. O chip contém milhées 
de méddulos que implementam func¢des ldgicas juntamente 
com conexdes em espera. Na €poca do uso, essas conexdes 
sao ativadas ou desativadas (mediante sinais eletrénicos) 
para implementar uma capacidade especifica. 

No neocortex, essas conexodes de longa distancia que nao 
Sao uSadas acabam sendo podadas, um dos motivos pelos 
quais a adaptacao de uma regiao préxima do neocortex para 
compensar aquela que foi danificada acaba nao sendo tao 
eficiente quanto a regiao original. Segundo o estudo de 
Wedeen, as conexoes iniciais sao extremamente organizadas 
e repetitivas, assim como os prdéprios mddulos, e seu padrao 
em grade é usado para “guiar a conectividade” no 
neocortex. Esse padrao foi encontrado em todos os cérebros 
de primatas e de humanos estudados, e ficou evidente no 
neocortex como um todo, desde as regides que lidam com os 
primeiros padrées sensoriais até aquelas que tratam de 
emocoes de nivel superior. O artigo de Wedeen na revista 
Science concluiu que “a estrutura de grade dos caminhos 
cerebrais foi difusa, coerente e continua nos trés eixos 


principais de desenvolvimento”. Mais uma vez, isso remete a 
um algoritmo comum espalhado pelas funcoes neocorticais. 





A estrutura em grade altamente regular das conexdées iniciais do neocortex, 
descoberta num estudo do National Institutes of Health 


Ha muito que se sabe que pelo menos algumas regides 
determinadas do neocortex sao hierarquicas. A regiao mais 
bem estudada @€ o cortex visual, separado em areas 
conhecidas como V1, V2 e MT (também conhecida como 
V5). Quando avancgamos para areas superiores dessa regiao 
(“superiores” no sentido de processamento conceitual, nao 
em termos fisicos, pois o neocdértex tem a espessura apenas 
de um identificador de padroes), as propriedades que 
podem ser identificadas tornam-se mais abstratas. V1 
identifica extremidades muito basicas e formas primitivas. 
V2 pode identificar contornos, a diSparidade das imagens 


apresentadas pelos olhos, orientacao espacial e se uma 
porcao de uma imagem faz ou nao parte de um objeto ou do 
fundo da cena [6]. Regides de nivel superior do neocdrtex 
identificam conceitos como a identidade de objetos e rostos 
e seus movimentos. Alem disso, ha muito que se sabe que a 
comunicacao através dessa hierarquia da-se tanto para cima 
como para baixo, e que os sinais podem tanto ser excitantes 
como inibidores. Tomaso Poggio (nascido em_ 1947), 
neurocientista do MIT, estudou a fundo a visSao no cérebro 
humano, e sua pesquisa dos ultimos 35 anos tem sido 
fundamental para estabelecer o aprendizado hierarquico e a 
identificagao de padrées nos niveis “iniciais” (mais baixos 
em termos conceituais) do neocértex visual [7]. 





Outra visdao da estrutura regular de grade das conex6ées neocorticais 





A estrutura de grade encontrada no neocortex é notavelmente similar aquilo 
que se denominou comutacao crossbar, usada em circuitos integrados e em 
placas de circuitos 


Nosso entendimento dos niveis hierarquicos mais baixos 
do neocortex visual 6 consistente com a TMRP que descrevi 
no capitulo anterior, e a obServacao da natureza hierarquica 
do processamento neocortical estendeu-se recentemente, 
Superando esses niveis em ampla medida. Daniel J. 
Felleman, professor de neurobiologia da Universidade do 
Texas, e seus colegas, situaram a “organizacao hierarquica 
do cortex cerebral... [em] 25 areas neocorticais”, incluindo 
tanto areas viSuais como areas de nivel superior que 
combinam padroes de diversos sentidos. O que descobriram 
ao subir pela hierarquia neocortical foi que o processamento 
de padroes torna-se mais abstrato, abrange areas espaciais 
maiores e envolve periodos de tempo mais extensos. Em 
cada conexao, encontraram comunicagoes ascendentes e 
descendentes na hierarquia [8]. 


Pesquisas recentes permitiram-nos ampliar 
substancialmente essas observacoes para regides bem além 
do cortex visual e até para as areas associativas, que 
combinam /nputs de diversos sentidos. Um estudo publicado 
em 2008 por Uri Hasson, professor de psicologia de 
Princeton, e seus colegas, demonstra que os fenédmenos 
observados no cortex visual ocorrem ao longo de uma ampla 
variedade de areas neocorticais: “Esta bem estabelecido que 
os neur6énios distribuidos ao longo dos caminhos corticais 
visuais tem campos receptivos espaciais cada vez maiores. 
Esse 6 um principio organizador basico do sistema visual [...] 
Eventos do mundo real ocorrem nao so em vastas regides do 
espaco, como também em longos periodos de tempo. 
Portanto, lancamos a hipdtese de que uma _ hierarquia 
analoga aquela encontrada para tamanhos de campos 
receptivos espaciais também deveria existir para as 
caracteristicas de respostas temporais de diferentes regides 
do cérebro”. E exatamente isso que eles encontraram, o que 
lhes permitiu concluir que “similar a hierarquia cortical 
conhecida dos campos receptivos espaciais, existe uma 
hierarquia de janelas receptivas temporais 
progressivamente mais longas no cérebro humano [9]”. 

O argumento mais poderoso para a universalidade de 
processamento no neocortex € a evidéncia onipresente da 
plasticidade (nao apenas no _ aprendizado, mas _ na 
intercambiabilidade): noutras palavras, uma_ regiao 
consegue fazer o trabalho de outras regides, implicando um 
algoritmo comum para todo o neocértex. Boa parte da 
pesquisa neurocientifica tem focalizado a identificacao das 
regides do neocodrtex responsaveis pelos diversos tipos de 
padroes. A técnica classica para isso consiste em aproveitar 
danos ao cérebro causados por ferimentos ou por um 


acidente vascular cerebral (AVC), correlacionando as 
funcoes perdidas com regides danificadas especificas. 
Assim, por exemplo, se percebemos que alguém com danos 
recém-sofridos na regiao do giro fusiforme comeca 
subitamente a ter dificuldade para identificar rostos, mas 
ainda consegue reconhecer as pessoas por meio de suas 
vozes ou padroes de linguagem, podemos hipotetizar que 
essa regiao tem alguma coisa a ver com a identificacao de 
rostos. A premissa subjacente foi a de que cada uma dessas 
regides se destina a reconhecer e processar um tipo 
especifico de padrao. Regides fisicas particulares foram 
associadas a tipos particulares de padroes, pois sob 
circunstancias normais as informacoes fluem dessa maneira. 
Mas quando esse fluxo normal de informacao é interrompido 
por algum motivo, outra regiao do neocértex pode entrar em 
cena e assumir a funcao. 

A plasticidade tem sido percebida pelos neurologistas, 
que observaram que pacientes com danos_ cerebrais 
causados por um ferimento ou um AVC podem tornar a 
aprender as mesmas habilidades noutra area do neocortex. 
Provavelmente, o exemplo mais notavel de plasticidade é 
um estudo feito em 2011 pela neurocientista norte- 
americana Marina Bedny e seus colegas sobre o que 
acontece com o cértex visual de pessoas cegas de nascen¢a. 
Acreditava-se que as primeiras camadas do cortex visual, 
como a V1 ea V2, lidavam intrinsecamente com padroes de 
nivel bem baixo (como arestas e curvas), enquanto o cértex 
frontal (uma regiao nova do cértex em termos evolutivos, 
que temos em nossas testas singularmente grandes) lidava 
inerentemente com os padroes bem mais complexos e sutis 
da linguagem e outros conceitos abstratos. Mas, como 
Bedny e seus colegas descobriram, “imagina-se que os seres 


humanos desenvolveram regides do cérebro no cortex 
frontal esquerdo e no cortex temporal que sao unicamente 
Capazes de processar a linguagem. No entanto, cegos de 
nascenga também ativam o cortex visual em algumas 
tarefas verbais. Apresentamos evidéncias de que essa 
atividade do cortex visual reflete, na verdade, um 
processamento de _ linguagem. Descobrimos que em 
individuos cegos de nascenca, o cortex visual esquerdo 
comporta-se de modo similar as regides classicas da 
linguagem [...]. Concluimos que as regides cerebrais que se 
acreditava que teriam evoluido para a visao podem assumir 
O processamento da linguagem como resultado de 
experiéncias na infancia [10]”. 

Pense nas implicacgoes desse estudo: isso significa que as 
regides neocorticais que estao a uma distancia fisica 
relativamente grande, e que também foram consideradas 
muito diferentes em termos conceituais (indicagoes visuais 
primitivas versus conceitos abstratos de linguagem), usam 
essencialmente oO mesmo algoritmo. As _ regides que 
processam esses tipos dispares de padroes podem se 
substituir mutuamente. 

Daniel E. Feldman, neurocientista da Universidade da 
California em Berkeley, escreveu em 2009 uma analise 
abrangente sobre o que ele chamou de “mecanismos 
sinapticos de plasticidade no neocdrtex”, e encontrou 
evidéncias para esse tipo de plasticidade em todo o 
neocortex. Ele escreve que “a plasticidade permite que o 
cérebro aprenda e recorde padroes no mundo sensorial, para 
aprimorar movimentos [...] @ para recuperar funcdes apds 
sofrer danos”. Acrescenta que essa plasticidade é possivel 
gragas a “mudancas_ estruturais, inclusive formacao, 


remocao e remodelagem morfoldgica de sinapses corticais e 
espinhas dendriticas [11]”. 

Outro exemplo espantoso de plasticidade neocortical (e 
portanto da uniformidade do algoritmo neocortical) foi 
demonstrada recentemente por cientistas da Universidade 
da Califérnia, em Berkeley. Eles conectaram arranjos de 
microeletrodos implantados para colher sinais cerebrais 
especificamente de uma regiao do cortex motor de 
Camundongos que controla 0 movimento de seus bigodes. 
Eles montaram o experimento para que os camundongos 
recebessem uma _ recompensa se_ controlassem seus 
neurdénios para disparar num certo padrao mental, mas sem 
mover os bigodes. O padrao exigido para obter a 
recompensa envolvia uma tarefa mental que normalmente é 
feita) pelos neurdnios frontais. Mesmo- assim, os 
Camundongos conseguiram realizar esse feito mental 
pensando com seus neurdénios motores e desacoplando-os 
mentalmente do controle dos movimentos motores [12]. A 
conclusao € que o cortex motor, a regiao do neocortex 
responsavel pela coordenacao dos movimentos musculares, 
também uSa 0 algoritmo neocortical padrao. 

Entretanto, ha varias razOes para que uma habilidade ou 
uma area de conhecimentos que tenha sido reaprendida 
usando uma nova area do neocortex para substituir outra 
que foi danificada nao seja necessariamente tao boa quanto 
a original. Primeiro, porque levou uma vida inteira para 
aprender e aperfeicoar uma _ habilidade  especifica: 
reaprendé-la noutra area nao vai gerar imediatamente os 
mesmos resultados. O mais importante 6 que essa nova area 
do neocdrtex nao estava parada, esperando agir como 
estepe para uma regiao danificada. Ela também estava 
realizando funcdes vitais, e por isso hesitara em abrir mao 


de seus padroes neocorticais para compensar a regiao 
lesionada. Ela pode comecar abandonando algumas das 
coépias redundantes de seus padroes, mas ao fazé-lo vai 
degradar sutilmente suas habilidades ja existentes, sem 
liberar © mesmo espaco cortical que as_ habilidades 
reaprendidas usavam originalmente. 

Ha uma terceira razao para que a plasticidade tenha seus 
limites. Como na maioria das pessoas tipos especificos de 
padroes fluem em regides especificas (como os rostos, que 
Sao processados pelo giro fusiforme), essas regides 
tornaram-se otimizadas (pela evolucao biolédgica) para esses 
tipos de padrdes. Como explico no capitulo 7, encontramos o 
mesmo resultado em nossos desenvolvimentos neocorticais 
digitais. Foi possivel identificar a fala com sistemas de 
identificagao de caracteres e vice-versa, mas os sistemas de 
fala estavam otimizados para a fala e, do mesmo modo, os 
sistemas de identificacao de caracteres estavam otimizados 
para caracteres impressos, de modo que haveria alguma 
reducao no desempenho se substituissemos um pelo outro. 
Na verdade, usamos algoritmos evolutivos (genéticos) para 
conseguir essa otimizacao, uma simulagao daquilo que a 
biologia faz naturalmente. Tendo em vista que na maioria 
das pessoas o giro fusiforme tem experimentado um fluxo de 
rostos ha centenas de milhares de anos (ou mais), a 
evolucao bioldgica teve tempo de desenvolver a capacidade 
de processar taiS padroes nessa regiao. Ela usa 0 mesmo 
algoritmo basico, mas orientado para rostos. Como escreveu 
Oo neurocientista holandés Randal Koene, “o [neo]cdértex é 
muito uniforme, e em principio cada coluna ou minicoluna 
pode fazer o que qualquer outra faz [13]”. 

Pesquisas recentes e substanciais apoiam a observacao 
de que os mddulos de identificag¢ao de padrdes se conectam 


com base nos padroes aos quais estao expostos. Veja o 
exemplo citado pela neurocientista Yi Zuo e seus colegas, 
que observaram quando novas “espinhas dendriticas” 
formaram conexdes entre célulaS nervosas quando 
Camundongos aprenderam uma nova habilidade (esgueirar- 
se por uma fenda para pegar uma _semente [14)). 
Pesquisadores do Instituto Salk descobriram que essa 
autoconexao critica dos mddulos do neocortex parece ser 
controlada por um pequeno grupo de genes. Esses genes e 
esse método de autoconexao também sao uniformes através 
do neocortex [15]. 

Muitos outros estudos documentam esses atributos do 
neocortex, mas vamos resumir 0 que podemos observar na 
literatura neurocientifica e em nossos prdprios experimentos 
mentais. A unidade basica do neocdértex € um méddulo de 
neurdénios, que estimo como sendo da ordem de cem. Eles 
estao entremeados em cada coluna neocortical, de modo 
que cada modulo nao fica visivelmente distinto. O padrao de 
conexées e de forcas sinapticas em cada méddulo 64 
relativamente estavel. As conexoes e as forcas sinapticas 
entre mddulos é que representam o aprendizado. 

O numero de conexdes no neocortex é da ordem de um 
quatrilhao (1015), mas s6 ha uns 25 milhdes de bytes de 
informacgao de desenho no genoma (apds uma compressao 
sem _perdas [16]), e por isso as conexdes em si nao podem 
ser predeterminadas geneticamente. E possivel que parte 
desse aprendizado seja o produto da interrogacao do 
cérebro. primitivo pelo neocdrtex, mas ainda assim 
representaria necessariamente apenas uma parcela de 
informacgao relativamente pequena. As conexdes entre os 
moddulos sao criadas totalmente a partir da experiéncia 
(formacao e nao natureza). 


O cérebro nao tem flexibilidade suficiente para que cada 
mddulo neocortical de identificacao de padroes possa 
simplesmente se ligar a qualquer outro mddulo (com a 
mesma facilidade como conseguimos fazer programas em 
nossos computadores ou na Internet) - 6 preciso que se 
forme uma conexao fisica real, composta de um axdnio 
conectando-se a um dendrito. Cada um de nds comeca com 
um amplo estoque de conexdes neurais possiveis. Como 
mostra o estudo de Wedeen, essaS conexdes sao 
organizadas de forma bastante repetitiva e organizada. A 
conexao terminal com esses ax6énios “de prontidao” ocorre 
com base nos padroes que cada identificador neocortical de 
padroes reconheceu. Conexodes nao utilizadas acabam sendo 
podadas. Essas conex6ées sao construidas hierarquicamente, 
refletindo a ordem hierarquica natural da realidade. Essa éa 
principal forca do neocortex. 

O algoritmo basico dos méddulos neocorticais de 
identificacao de padrdes é equivalente em todo o neocortex, 
desde os mddulos de “nivel inferior”, que lidam com os 
padroes sensoriais mais basicos, até os méddulos de “nivel 
Superior”, que reconhecem os conceitos mais abstratos. A 
ampla evidéncia da plasticidade e a intercambiabilidade das 
regides neocorticais atestam essa importante observacao. 
Ha alguma otimizacao das regides que lidam com tipos 
universais de padroes, mas esse é€ um efeito de segundo 
escalao - 0 algoritmo fundamental é universal. 

Os sinais sobem e descem pela hierarquia conceitual. Um 
sinal ascendente significa: “detectei um padrao”. Um sinal 
descendente significa: “estou esperando a ocorréncia do seu 
padrao”, sendo basicamente uma_ previsao.  Sinais 
ascendentes e descendentes podem ser tanto excitantes 
como inibidores. 


Cada padrao é, em si, uma ordem especifica, e nao pode 
ser revertido facilmente. Mesmo que um padrao aparente 
tenha aspectos multidimensionais, ele € representado por 
uma sequéncia unidimensional de padroes de nivel inferior. 
Um padrao & uma sequéncia ordenada de outros padroées, de 
modo que cada identificador é intrinsecamente recursivo. 
Pode haver muitos niveis hierarquicos. 

Ha uma boa dose de redundancia nos padroes que 
aprendemos, especialmente nos mais importantes. A 
identificagao de padroes (como objetos comuns e rostos) usa 
Oo mesmo mecanismo que nossas Memorias, que SAO apenas 
padroes que aprendemos. Elas também sao armazenadas 
como sequéncias de padroes - basicamente, sao historias. 
Esse mecanismo também é usado para 0 aprendizado e para 
a realizacao de movimentos fisicos no mundo. A 
redundancia de padroes € que nos permite identificar 
objetos, pessoas e ideias, mesmo quando tém variacdes e 
ocorrem em _ contextos diferentes. Os parametros de 
tamanho e de variabilidade do tamanho também permitem 
que o neocortex codifique a varia¢ao na magnitude em 
dimensoes diferentes (duragao no caso do som). Um modo 
pelo qual esses parametros de magnitude podem ser 
codificados é simplesmente por meio de padroes multiplos 
com numeros distintos de inputs repetidos. Assim, por 
exemplo, poderia haver padroes para a palavra falada 
“steep” com diversos numeros da vogal longa [E] repetida, 
cada uma com o parametro de importancia ajustado num 
nivel moderado, indicando que a repeticao de [E] é variavel. 
Essa abordagem nao é equivalente em termos matematicos 
a ter parametros de tamanho explicitos, e nao funciona tao 
bem na pratica, mas € uma abordagem para codificar a 
magnitude. A evidéncia mais forte que temos para esses 


parametros é que eles sao necessarios em nossos sistemas 
de IA para obtermos niveis de precisao que se aproximam 
dos niveis humanos. 

O resumo acima constitui as conclus6es que podemos 
tirar da amostragem de resultados de pesquisas que 
compartilhei antes, bem como da amostragem de 
experimentos mentais que _ discutimos anteriormente. 
Sustento que o modelo que apresentei 6 o Unico modelo 
possivel que satisfaz todas as limitacédes estabelecidas pela 
pesquisa e por nossos experimentos mentais. 

Finalmente, ha mais uma evidéncia corroborativa. As 
técnicas que desenvolvemos nas ultimas décadas no campo 
da _ intelig@éncia artificial para identificar e processar 
inteligentemente fenédmenos do mundo real (como a fala 
humana e a linguagem escrita) e@ para compreender 
documentos em linguagem natural mostraram-se similares, 
em termos matematicos, ao modelo que apresentei acima. 
Elas também sao exemplos de TMRP. O campo da IA nao 
estava tentando copiar explicitamente o cérebro, mas, 
mesmo assim, chegou aé_ técnicas  essencialmente 
equivalentes. 


¢ Capitulo 5 e 


O cérebro primitivo 


Tenho um cérebro primitivo, mas uma memoria barbara. 
- Al Lewis 


Ca estamos, no meio desse novo mundo com nosso cérebro 
primitivo, sintonizado com a vida simples das cavernas, com forcgas 
terriveis a nossa disposicao, que somos espertos o suficiente para 
liberar, mas cujas consequéncias nao podemos compreender. 

- Albert Szent-Gyorgyi 


osso cérebro primitivo - aquele que tinhamos antes de 
N sermos mamiferos - nao desapareceu. Na verdade, ele 
ainda proporciona boa parte de nossa motivacao na procura 
de gratificacao e de se evitar 0 perigo. Essas metas, porém, 
sao moduladas pelo neocdrtex, que domina o cérebro 
humano tanto em massa como em atividade. 

Os animais costumavam viver e sobreviver sem um 
neocortex, e, com efeito, todos os animais nao mamiferos 
continuam ainda hoje sobrevivendo dessa _ maneira. 
Podemos entender o neocdértex humano como o grande 
sublimador - e por isso, nossa motivacao primitiva para 
evitar um grande predador pode ser transformada hoje pelo 
neocortex na conclusao de uma tarefa para impressionar o 
chefe; a grande cacada pode se tornar a redacao de um livro 


- sobre a mente, por exemplo; e a procura da reproducao 
pode se transformar na obtencao do reconhecimento publico 
ou na decoracao de seu apartamento. (Bem, esta Ultima 
motivagao nem sempre esta tao bem oculta.) 

Do mesmo modo, o neocodrtex é bom para nos ajudar a 
resolver problemas, pois ele pode fazer um modelo preciso 
do mundo, refletindo sua natureza_ verdadeiramente 
hierarquica. Mas € o cérebro primitivo que nos apresenta 
esses problemas. Naturalmente, como qualquer burocracia 
Sagaz, 0 neocdértex costuma lidar com os problemas que Ihe 
sao destinados redefinindo-os. A esse respeito, vamos 
estudar oO processamento da _ informacao no_ cérebro 
primitivo. 


O caminho sensorial 


Imagens, propagadas pelo movimento ao longo das fibras dos 
nervos Opticos no cérebro, sao a causa da visdao. 
- Isaac Newton 


Cada um de nos vive no universo - a prisao - de seu proprio 
cérebro. Ha, projetando-se dele, milhdes de frageis fibras nervosas 
sensoriais, em grupos singularmente adaptados para avaliar os 
estados energéticos do mundo a nossa volta: calor, luz, forca e 
composicao quimica. Isso 6 tudo que conhecemos diretamente 
sobre ele; todo o resto sao inferéncias ldgicas. 

- Vernon Mountcastle [1] 


Embora tenhamos a ilusao de receber imagens de alta 
resolucao de nossos olhos, 0 que na verdade o nervo Optico 
envia para o cérebro 6 apenas uma série de perfis e de 
pistas sobre pontos de interesse de nosso campo visual. 
Depois, basicamente temos alucinagoes sobre 0 mundo a 
partir de lembrancgas corticais que interpretam uma série de 


filmes com indices de dados muito baixos, que chegam em 
Ccanais paralelos. Num estudo publicado na revista Nature, 
Frank S. Werblin, professor de biologia molecular e celular 
da Universidade da Califérnia em Berkeley, e 0 doutorando 
Boton Roska, MD, mostraram que o nervo éptico contém de 
dez a doze outputs, cada um dos quais conduzindo apenas 
uma pequena quantidade de informacgdoes sobre uma cena 
especifica [2]. Um grupo das chamadas células ganglionares 
envia informagoes apenas sobre extremidades (mudancas 
de contraste). Outro grupo detecta apenas grandes areas de 
cor uniforme, enquanto um terceiro grupo é sensivel apenas 
aos cenarios de fundo por tras de figuras de interesse. 





O caminho visual no cérebro 


“Apesar de pensarmos que vemos 0 mundo com tamanha 
plenitude, o que recebemos na verdade sao apenas pistas, 
limites no tempo e no espaco”, diz Werblin. “Essas 12 
imagens do mundo constituem toda a informacao que 
teremos sobre o que existe la fora, e a partir dessas 12 
imagens, que sao tao esparsas, reconstruimos a riqueza do 
mundo visual. Tenho curiosidade de saber como a natureza 
selecionou esses 12 filmes simples e como podem ser 
suficientes para nos proporcionar todas as informacoes de 
que parecemos precisar.” 

Essa reducao de dados € o que chamamos de 
“codificag¢ao esparsa” no campo da IA. Ao criar sistemas 
artificiais, descobrimos que jogar fora a maior parte das 
informagoes de input e reter apenas os detalhes mais 
evidentes proporciona resultados superiores. Nao sendo 
assim, a capacidade limitada de processamento de 
informacgdes do neocortex (biolédgico ou nao) fica 
sobrecarregada. 





Sete dos doze "filmes" de baixa definicado enviados pelo nervo dptico ao cérebro 


O processamento de informacées auditivas da cdclea 
humana através das regides subcorticais e depois pelos 
primeiros estagios do  neocdrtex foi modelado 
meticulosamente por Lloyd Watts e sua equipe de pesquisa 
na Audience, Inc [3]. Eles desenvolveram uma tecnologia de 
pesquisa que extrai 600 faixas de frequéncia diferentes do 
som (60 por oitava). Isso se aproxima muito mais da 
estimativa de 3 mil faixas extraidas pela céclea humana 
(compare com a identifica¢ao comercial da fala, que usa 
apenas de 16 a 32 faixas). Usando dois microfones e seu 
detalhado modelo de processamento auditivo (com alta 
resolucao espectral), a Audience criou uma _ tecnologia 
comercial (com uma resolucao espectral um pouco inferior a 
de seu sistema de pesquisa) que remove efetivamente o 
ruido de fundo de conversas. Hoje, ela esta sendo usada em 
muitos celulares populares e € um exemplo impressionante 
de um produto comercial baseado num entendimento sobre 
como o sistema humano de percepcao auditiva é capaz de 
focalizar uma fonte sonora de interesse. 





Caminho auditivo do cérebro 
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Modelo simplificado do processamento auditivo nas areas subcorticais (areas 
anteriores ao neocortex) e no neocortex, criado pela Audience, Inc. Figura 
adaptada de WATTS, L. Reverse-Engineering the Human Auditory Pathway. In 
LIU, J. et al (eds.). WCC! 2012. Berlim: Springer-Verlag, 2012, p. 49 


Inputs do corpo (estimado em centenas de megabits por 
segundo), inclusive provenientes de nervos da pele, de 
musculos, 6rgaos e outras areas, fluem pela medula espinhal 
superior. Essas mensagens envolvem mais do que uma mera 
comunicagao sobre o tato; além disso, transportam 
informacdoes sobre temperatura, niveis de acidez (como o de 
acido latico nos musculos), o movimento de alimentos pelo 


trato gastrointestinal e muitos outros sinais. Esses dados sao 
processados pelo tronco cerebral e pelo mesencéfalo. 
Células importantes, chamadas neurénios da lamina |, criam 
um mapa do corpo, representando seu estado atual, algo 
nao muito diferente dos monitores usados_ pelos 
controladores de voo para acompanhar os avides. Dali, os 
dados sensoriaiS vaoO para uma regiao misteriosa chamada 
talamo, 0 que nos leva a nosso préximo tdpico. 


O talamo 


Todos sabem o que significa a atencao. E a tomada de posse por 
parte da mente, de maneira clara e nitida, de um entre aqueles que 
parecem ser diversos objetos ou sequéncias de pensamento 
simultaneamente possiveis. Focalizag¢ao e@ concentracdo da 
consciéncia fazem parte de sua esséncia. Implicam o afastamento 
de algumas coisas a fim de se poder lidar efetivamente com outras. 
- William James 


Do mesencéfalo, a informacao sensorial flui através de uma 
regiao do tamanho de uma noz chamada_ nucleo 
ventromedial posterior (com sigla em inglés VMpo) do 
talamo, que computa reagcdes complexas como estados 
corporais, como “isto tem um gosto horrivel”, “que cheiro 
ruim” ou “esse toque luminoso é estimulante”. A informacao, 
cada vez mais processada, termina em duas regides do 
neocortex chamadas insulas. Essas estruturas, do tamanho 
de dedos pequenos, localizam-se dos lados esquerdo e 
direito do neocdrtex. O dr. Arthur Craig, do Barrow 
Neurological Institute em Phoenix, descreve as duas regides 
da insula como “um sistema que representa o eu_material 
[4]”. 


Entre suas outras funcdes, o talamo é considerado um 
portal para que as informacoes sensoriais pré-processadas 
entrem no neocortex. Além das informacoes tateis que fluem 
pelo VMpo, informacdes processadas do nervo Optico (que, 
como dito antes, ja foi transformado substancialmente) sao 
enviadas para uma regiao do talamo chamada nucleo 
geniculado lateral, que depois as envia para a regiao V1 do 
neocortex. A informacao do sentido da audicao € passada 
via o nucleo geniculado medial do talamo a caminho das 
primeiras regides auditivas do neocdrtex. Todos os nossos 
dados sensoriais (exceto, aparentemente, o sistema olfativo, 
que usa 0 bulbo olfativo) passam por regides especificas do 
talamo. 
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O caminho sensorial tatil no cérebro 


O papel mais significativo do talamo, porém, é€ sua 
comunicacao continua com o neocortex. Os identificadores 
de padrao do neocortex enviam resultados provis6érios para 
o talamo e recebem respostas principalmente utilizando 
sinaiS reciprocos excitantes e inibidores da camada VI de 
cada identificador. Lembre-se de que nao sao mensagens 
sem fio, e por isso € preciso uma quantidade extraordinaria 
de fiacao fisica (na forma de axdnios) que liga todas as 
regides do neocortex ao talamo. Pense na enorme 
quantidade de espacgo (em termos da massa fisica de 
conex6des necessarias) para que as centenas de milhdes de 
identificadores de  padroes do- neocortex fiquem 
constantemente em conferéncia com o talamo [5]. 

Bem, e sobre o que as centenas de milhoes de 
identificadores de padroes neocorticais conversam com o 
talamo? Aparentemente, 6 uma conversa importante porque 
danos profundos causados bilateralmente a principal regiao 
do talamo podem levar a uma inconsciéncia prolongada. 
Uma pessoa com talamo lesionado ainda pode ter atividade 
no neocdértex, uma vez que o pensamento autoprovocado 
por associacao ainda pode funcionar. Mas o pensamento 
direcionado - do tipo que nos tira da cama, leva até 0 carro e 
nos poe diante da escrivaninha para trabalhar - nao 
funciona sem talamo. Num caso famoso, Karen Ann Quinlan, 
de 21 anos, sofreu um atague cardiaco e insuficiéncia 
respiratoria, e ficou vivendo num estado aparentemente 
vegetativo e irresponsivo durante dez anos. Ao morrer, sua 
autdpsia revelou que seu neocortex estava normal, mas seu 
talamo havia sido destruido. 

Para poder desempenhar seu papel crucial em nossa 
Ccapacidade de direcionar a atencao, o talamo apoia-se no 
conhecimento estruturado contido no neocortex. Ele pode 


percorrer uma lista (armazenada no neocortex), permitindo- 
nos seguir um fluxo mental ou acompanhar um plano de 
acao. Aparentemente, somos capazes de manter até quatro 
itens por vez em nossa memoria operacional, dois por 
hemisfério, segundo pesquisas recentes realizadas no 
Picower Institute for Learning and Memory [Instituto Picower 
para o Aprendizado e a Memoria] do MIT [6]. A duvida sobre 
se o talamo controla 0 neocértex ou vice-versa esta longe de 
ter sido resolvida, mas nao somos capazes de funcionar sem 
os dois. 


O hipocampo 


Cada hemisfério cerebral contém um hipocampo, uma 
pequena regiao que se parece com um cavalo-marinho, 
situado no lobo temporal medial. Sua funcao primordial é a 
recordacgao de novos eventos. Como a informacao sensorial 
flui através do neocértex, cabe ao neocortex determinar que 
uma experiéncia 6 nova a fim de apresenta-la ao hipocampo. 
Ele o faz ou ao deixar de identificar um conjunto de 
caracteristicas especificas (Como numa nova fisionomia, por 
exemplo) ou percebendo que uma situacao que antes lhe 
era familiar passou a ter atributos Unicos (como seu cénjuge 
usando um bigode postico). 

O hipocampo é capaz de recordar essas situacdes, apesar 
de parecer fazé-lo primariamente por meio de indicadores 
no neocdrtex. Assim, aS mMemorias no hipocampo também 
Sao armazenadas como padroes de nivel inferior que antes 
foram identificados e armazenados no neocortex. Para que 
animais sem neocdértex modulem experiéncias sensoriais, o 
hipocampo vai simplesmente recordar a informacao a partir 
dos sentidos, embora ela tenha_  sofrido um _ pré- 


processamento sensorial (como as transformac6es realizadas 
pelo nervo Optico, por exemplo). 

Embora o hipocampo facga uso do neocdrtex (se um 
cérebro em particular tem um) como bloco de rascunho, sua 
memoria (de  indicadores no neocortex) nao é 
intrinsecamente hierarquica. Animais sem neocdértex podem, 
portanto, recordar-se de coisas usando o hipocampo, mas 
essas lembrancas nao serao hierarquicas. 

A capacidade do hipocampo é limitada, e por isso sua 
memoria €@ de curto prazo. Ele transfere uma sequéncia 
particular de padrées de sua memoria de curto prazo para a 
memoria hierarquica de longo prazo do neocortex, 
repassando repetidas vezes essa sequéncia de memoria 
para o neocortex. Portanto, precisamos do hipocampo a fim 
de aprender novas memorias e habilidades (embora as 
habilidades estritamente motoras parecam usar um 
mecanismo diferente). Alguém que tenha sofrido danos no 
hipocampo em ambos os hemisférios vai manter as 
memorias ja existentes, maS nao sera capaz de formar 
novas. 

Theodore Berger, neurocientista da Universidade do Sul 
da Califérnia, e seus colegas modelaram o hipocampo de um 
rato e fizeram experimentos bem-sucedidos com o implante 
de um hipocampo artificial. Num estudo publicado em 2011, 
os cientistas da USC bloquearam, por meio de drogas, 
comportamentos aprendidos especificos em ratos. Usando 
um hipocampo artificial, os ratos conseguiram tornar a 
aprender o comportamento rapidamente. “Ligue a chave e 
os ratos se lembram. Desligue-a e os ratos se esquecem”, 
escreveu Berger, referindo-se a sua capacidade de controlar 
remotamente o implante neural. Noutro experimento, os 
cientistas permitiram que seu hipocampo _ artificial 


trabalhasse juntamente com o hipocampo natural dos ratos. 
O resultado foi que a capacidade dos ratos de aprender 
novos comportamentos foi fortalecida. “Esses estudos de 
modelos experimentais integrados mostram pela primeira 
vez que [...] uma prdtese neural capaz de identificar e 
manipular em tempo real o processo de codificagao pode 
restaurar e até melhorar os processos mnemédnicos 
cognitivos”, explicou Berger. O hipocampo @ uma das 
primeiras regides danificadas pelo Mal de Alzheimer, e assim 
uma meta dessa pesquisa é desenvolver um implante neural 
para humanos que mitigue essa primeira fase de danos da 


doenca. 


O cerebelo 


Existem dois métodos para pegar uma bola no ar. Podemos 
resolver aS complexas equacdes diferenciais simultaneas 
que controlam o movimento da bola, bem como outras 
equacdes que governam nosso proprio angulo de visao da 
bola, e depois calcular novas equacoes que tratam da 
maneira como devemos mover 0 corpo, 0 braco e€ a mao para 
estar no lugar certo na hora certa. 

Mas nao € esse o método adotado pelo nosso cérebro. 
Basicamente, ele simplifica o problema, reunindo diversas 
equacdes num modelo simples de tendéncias, levando em 
conta a tendéncia de onde a bola parece estar em nosso 
Campo de visao e a rapidez com que ela se desloca nele. Ele 
faz a mesma coisa com nossa mao, simplesmente gerando 
predicoes lineares da posicao aparente da bola em nosso 
campo de visao e a posicao da mao. Naturalmente, a meta é 
assegurar que se encontrem no mesmo ponto no espaco e 
no tempo. Se a bola parece estar caindo depressa demais e 


nossa mao parece se mover com demasiada lentidao, nosso 
cérebro vai orientar a mao a se mover mais rapidamente, 
para que as tendéncias coincidam. Essa solucao do “no 
gdordio” para algo que seria um problema matematico 
insoluvel @€ chamada funcao basica, e é realizada pelo 
cerebelo, uma regiao com a forma de um feijao, mas do 
tamanho de uma bola de beisebol, apoiada no tronco 
cerebral [8]. 

O cerebelo 6 uma regiao do cérebro primitivo que antes 
controlava praticamente todos os movimentos’ dos 
hominideos. Ele ainda contém metade dos neurdnios do 
cérebro, embora a maioria seja relativamente pequena, e por 
isSO a regiao representa apenas 10% do peso do cérebro. De 
modo analogo, o cerebelo representa outro exemplo de 
repeticao macica no desenho do cérebro. Ha relativamente 
poucas informacoes sobre seu design no genoma, uma vez 
que sua estrutura 6 um padrao de diversos neurdnios que se 
repete bilhdes de vezes. Tal como ocorre com o neocortex, 
sua estrutura 6 bem uniforme [9]. 

A maior parte da funcao de controle dos musculos foi 
assumida pelo neocdrtex, usando os mesmos algoritmos de 
reconhecimento de padroes que ele uSa para percepcao e 
cognicao. No caso do movimento, podemos nos referir mais 
apropriadamente a funcgao do neocdértex como sendo a 
implementacao de padroes. O neocortex utiliza a memoria 
do cerebelo para registrar roteiros de movimento delicados; 
por exemplo, sua assinatura e certos floreios de expressao 
artistica, como musica e danca. Estudos do papel do 
cerebelo durante o aprendizado da escrita em criancgas 
revelaram que as células Purkinje do cerebelo fazem uma 
amostragem da sequéncia de movimentos, sendo cada uma 
sensivel a uma amostra especifica [10]. Como a maior parte 


de nossos movimentos é€ controlada hoje pelo neocortex, 
muitas pessoas vivem com uma incapacidade dbvia e 
relativamente modesta, mesmo com danos significativos ao 
cerebelo, s6 que seus movimentos podem se tornar menos 
graciosos. 

O neocértex também pode invocar o cerebelo para usar 
Sua Capacidade de computar funcdoes basicas em tempo real 
a fim de prever os resultados de agdes que estamos levando 
em conta, mas que ainda nao realizamos (e que talvez 
nunca realizemos), bem como as acdes ou possiveis acdes 
de terceiros. E outro exemplo dos precisos preditores 
lineares inatos embutidos no cérebro. 

Houve um _ progresso substancial na simulacgao do 
cerebelo em _ relacao a capacidade de_ responder 
dinamicamente a pistas sensoriais usando as func¢oes 
basicas que discuti acima, tanto em simulacdes de baixo 
para cima (baseadas em modelos bioquimicos) como em 
simulacoes de cima para baixo (baseadas em modelos 
matematicos do modo como cada unidade repetidora do 
cerebelo opera [11]). 


Prazer e medo 


O medo € a principal fonte de supersticao, e uma das principais 
fontes da crueldade. Dominar 0 medo € 0 comeco da sabedoria. 
- Bertrand Russell 


Sinta o medo, mas faca o que tem de fazer. 
- Susan Jeffers 


Se o neocértex é€ habil para resolver problemas, entao qual é 
O principal problema que estamos tentando resolver? O 


problema que a evolucao sempre tentou resolver é a 
sobrevivéncia da espécie. Isso se traduz na sobrevivéncia do 
individuo, e cada um de nos uSa seu proprio neocdrtex para 
interpretar essa questao de milhares de formas. Para 
sobreviver, OS animaiS precisam buscar sua _ prdxima 
refeicao, ao Mesmo tempo em que evitam ser a refeicao de 
outros. Eles também precisam se reproduzir. Os cérebros 
mais primitivos desenvolveram sistemas de prazer e de 
medo que recompensavam a Satisfacao dessas necessidades 
fundamentais, bem como os comportamentos basicos que as 
propiciavam. Com a mudanca gradual dos ambientes e das 
especies concorrentes, a evolucao biolégica fez alteracdes 
correspondentes. Com o- advento do  pensamento 
hierarquico, a satisfacao de impulsos criticos tornou-se mais 
complexa, pois agora estava sujeita a vasta complexidade 
das ideias dentro de ideias. Mas apesar de sua consideravel 
modulacao pelo neocortex, o cérebro primitivo ainda esta 
vivo e ativo, motivando-nos com prazer e medo. 

Uma regiao associada ao prazer é€ o nucleo accumbens. 
Em experimentos famosos realizados na década de 1950, 
ratos que conseguiam estimular diretamente essa pequena 
regiao (empurrando uma alavanca que ativava eletrodos 
implantados) preferiam fazé-lo em detrimento de qualquer 
outra coisa, inclusive sexo ou comida, acabando por se 
esgotarem e morrerem de fome [12]. Nos humanos, outras 
regides também estao envolvidas no prazer, como o palido 
ventral e, naturalmente, o préprio neocértex. 

O prazer também é€ regulado por substancias quimicas 
como a dopamina e a serotonina. Nao cabe no escopo deste 
livro discutir detalhadamente esses sistemas, mas é 
importante perceber que herdamos esses mecanismos de 
nossos primos pré-mamiferos. A tarefa do neocortex é 


permitirnos ser senhores do prazer e do medo, e nao seus 
escravos. Como estamos’ frequentemente sujeitos a 
comportamentos viciantes, 0 neocdértex nem sempre tem 
éxito nessa tarefa. A dopamina, em particular, @€ um 
neurotransmissor envolvido na experiéncia do prazer. Se 
alguma coisa boa acontece conosco - ganhar na loteria, 
obter o reconhecimento de nossos colegas, receber um 
abrago de um ente querido, ou mesmo realizagoes sutis, 
como fazer com que um amigo ria de uma piada -, 
recebemos uma liberacao de dopamina. As vezes, nés, como 
os ratos que morreram por causa do estimulo excessivo do 
nucleo accumbens, uSamos um atalho para obter essas 
explosdes de prazer, o que nem sempre € uma boa ideia. 

O jogo, por exemplo, pode liberar dopamina, pelo menos 
quando vocé ganha, mas isso depende de sua falta inerente 
de previsibilidade. O jogo pode funcionar durante algum 
tempo para a liberacao de dopamina, mas tendo em vista 
que as chances sao intencionalmente contrarias a vocé (do 
contrario, © modelo de negdcio de um cassino nao 
funcionaria), ele pode se tornar ruinoso como estratégia 
regular. Perigos similares estao associados a qualquer 
comportamento viciante. Uma mutacao genética especifica 
do gene D2 receptor de dopamina causa sensagoes de 
prazer particularmente fortes nas primeiras experiéncias 
com substancias e comportamentos viciantes, mas, como é 
bem sabido (mas nem sempre lembrado), a capacidade de 
producao de prazer dessas substancias costuma declinar 
com o uso subsequente. Outra mutacao genética resulta do 
fato de as pessoas nao receberem niveis normais de 
liberagao de dopamina com realizacgoes cotidianas, 0 que 
também pode levar a procura de experiéncias iniciais mais 
intensas com atividades viciantes. A minoria da populacao 


que tem essas tendéncias genéticas ao vicio cria um enorme 
problema social e médico. Até aqueles que conseguem 
evitar cComportamentos seriamente viciantes lutam para 
equilibrar as recompensas da liberagao de dopamina com as 
consequéncias dos comportamentos que as produzem. 

A serotonina € um neurotransmissor que desempenha um 
papel importante na regula¢ao do humor. Em_ niveis 
elevados, ela esta associada a sensacdes de bem-estar e 
contentamento. A serotonina tem outras funcoes, inclusive a 
modulacao da forca sinaptica, do apetite, do sono, do desejo 
sexual e da _ digestao. Drogas antidepressivas, como 
inibidores seletivos da recaptacao da serotonina (que 
tendem a aumentar os niveis de serotonina disponiveis para 
os receptores), costumam ter efeitos abrangentes, nem 
todos desejaveis (como a reducao da libido). Ao contrario de 
acdes no neocortex, no qual o reconhecimento de padroes e 
as ativacdes de axdénios afetam apenas um pequeno numero 
de circuitos neocorticais de cada vez, essas substancias 
afetam grandes regides do cérebro, ou até todo o sistema 
nervoso. 

Cada hemisfério do cérebro humano tem uma amigdala, 
que consiste numa regiao em forma de améndoa 
compreendendo diversos lobos pequenos. A amigdala 
também pertence ao cérebro primitivo e esta envolvida no 
processamento de diversos tipos de reagcao emocional, 
sendo o medo a mais notavel. Em animais pré-mamiferos, 
certos estimulos pré-programados representando perigo vao 
diretamente para a amigdala, que por sua vez aciona o 
mecanismo de “lutar ou fugir”. Nos seres humanos, a 
amigdala depende agora da transmissao da percepcao do 
perigo por parte do neocdrtex. Um comentario negativo de 
seu chefe, por exemplo, pode provocar tal reagao, gerando o 


medo de perder 0 emprego (ou talvez nao, caso vocé tenha 
confianca num plano B). Quando a amigdala decide que ha 
um perigo pela frente, da-se uma sequéncia antiga de 
eventos. A amigdala envia um sinal para que a glandula 
pituitaria libere um horménio  chamado ACTH 
(adrenocorticotropina). Este, por sua vez, aciona o horménio 
do estresse, cortisol, das glandulas suprarrenais, 0 que 
resulta no fornecimento de mais energia para seus musculos 
e sistema nervoso. As glandulas suprarrenais também 
produzem adrenalina e noradrenalina, que inibem os 
sistemas digestivo, imunoldégico e reprodutor (imaginando 
que nao sao processos prioritarios numa emergéncia). Os 
niveis de pressao sanguinea, acucar no sangue, colesterol e 
fibrinogénio (que acelera a coagulacao do sangue) sobem. 
Os batimentos cardiacos e a respiragcao aceleram. Até suas 
pupilas se dilatam para que vocé tenha uma visao mais 
precisa de seu inimigo ou de sua rota de fuga. Tudo isso é 
muito util caso um perigo real, como um predador, cruze 
inesperadamente o seu caminho. Sabe-se bem que no 
mundo de hoje a ativacao crénica desse mecanismo de lutar 
ou fugir pode levar a danos permanentes a saude em termos 
de hipertensdao, elevados niveis de colesterol e outros 
problemas. 

O sistema dos niveiSs de neurotransmissores globais, 
como a serotonina, e dos niveis de horménios, como a 
dopamina, é complexo, e poderiamos passar o resto deste 
livro tratando do problema (como muitos livros ja fizeram), 
mas vale a pena lembrar que a largura de faixa da 
informacgao (a proporcao de processamento da informacao) 
nesse sistema 6 muito baixa, em comparacao com a largura 
de faixa do neocdrtex. Ha um numero limitado de 
substancias envolvidas e os niveis dessas substancias 


tendem a mudar lentamente, além de serem relativamente 
universaiS no cérebro se 0 compararmos com o neocortex, 
que € composto de centenas de trilhOes de conexdes que 
podem mudar rapidamente. 

E razoavel dizer que nossas experi€ncias emocionais 
ocorrem tanto no cérebro primitivo como no novo. O 
pensamento se da no novo cérebro (o neocértex), mas os 
sentimentos ocorrem em ambos. Qualquer emulagao do 
comportamento humano, portanto, precisa modelar ambos. 
No entanto, se estivermos procurando apenas pela 
intelig@ncia cognitiva humana, o neocodrtex é€ suficiente. 
Podemos substituir o cérebro primitivo pela motivacao mais 
direta de um neocortex nao biolégico para cumprir as metas 
que nos sao atribuidas. Por exemplo, no caso de Watson, a 
meta foi estabelecida de forma simples: consiga as respostas 
corretas para as perguntas de Jeopardy! (embora estas 
fossem moduladas adicionalmente por um programa que 
compreendia as apostas de /eopardy!). No caso do novo 
sistema desenvolvido em conjunto pela Nuance e pela IBM 
para conhecimento médico, a meta sera ajudar a tratar 
doencas humanas. Sistemas futuros podem ter metas como 
curar de fato doencas e aliviar a pobreza. Boa parte do 
conflito prazer-medo ja é obsoleta para os humanos, pois o 
cérebro primitivo evoluiu muito antes do surgimento das 
sociedades humanas primitivas; com efeito, a maior parte 
dele é reptiliana. 

Existe um esforco continuo no cérebro humano para 
decidir se quem esta no comando é o cérebro primitivo ou o 
novo. O cérebro primitivo tenta estabelecer a agenda com 
seu controle das experi@ncias de prazer e medo, enquanto o 
cérebro novo esta sempre tentando compreender os 
algoritmos relativamente primarios do cérebro primitivo e 


tentando manipula-lo segundo sua propria agenda. Leve em 
conta o fato de a amigdala nao poder avaliar perigos 
sozinha - no cérebro humano, ela depende dos julgamentos 
do neocortex. Essa pessoa é amiga ou inimiga, amistosa ou 
ameaca? S6 o neocortex pode decidir. 

Como nao estamos envolvidos diretamente em combates 
mortais nem em cacadas por comida, temos tido sucesso na 
sublimacao, pelo menos parcial, de nossos impulsos antigos 
em nome de empreendimentos mais criativos. Nesse 
sentido, vamos discutir criatividade e amor no capitulo 
seguinte. 


¢ Capitulo 6 « 


Habilidades transcendentes 


Esta 6 minha religiao simples. Nao ha necessidade de templos; nao 
ha necessidade de filosofias complicadas. Nosso proprio cérebro, 
nosso proprio coracao € nosso templo; a filosofia 6 a bondade. 

- O Dalai Lama 


Minha mao se movimenta porque certas forcas - elétricas, 
magnéticas ou seja la o que essa “forca nervosa” se revele ser - sao 
impressas sobre ela por meu cérebro. A origem dessa forca nervosa, 
armazenada no cérebro, provavelmente seria identificada, caso a 
Ciéncia fosse completa, em forcas quimicas fornecidas ao cérebro 
pelo sangue, e, em ultima analise, no alimento que como e no ar 
que respiro. 

- Lewis Carroll 


ossos pensamentos emocionais também ocorrem no 
N neocortex, mas sao influenciados por partes do cérebro 
que vao desde regides do cérebro primitivo, como a 
amigdala, até algumas estruturas cerebrais recentes em 
termos evolutivos, como os neurdnios fusiformes, que 
parecem ter um papel importante em emocées de nivel 
superior. Diferentemente das estruturas recursivas regulares 
e lIégicas encontradas no cortex cerebral, os neurdnios 
fusiformes tém formas e conexoes altamente irregulares. Sao 
OS maiores neurdénios do cérebro humano e se estendem por 


ele todo. Sao profundamente interconectados, com centenas 
de milhares de conexoes que unem diversas porcoes do 
neocortex. 

Como dito antes, a insula ajuda a processar sinais 
sensoriais, mas ela também tem um papel vital nas emocdes 
de nivel superior. E nessa regido que se originam as células 
fusiformes. A técnica de imagem por ressonancia magnética 
funcional (IRMf) revelou)§ que essas_ células’ ficam 
particularmente ativas quando a pessoa lida com emocoes 
como amor, raiva, tristeza e desejo sexual. Entre as 
situagdes que ativam intensamente essas células, podemos 
elencar 0 momento em que a pessoa olha para o parceiro ou 
escuta o proprio bebé chorando. 

As células fusiformes tém longos filamentos nervosos 
chamados dendritos apicais, capazes de se conectar com 
regides neocorticais  distantes. Essa _ interconexao 
“profunda”, na qual certos neurdénios proporcionam 
conex6es entre diversas regides, 6 uma caracteristica que 
ocorre com frequéncia cada vez maior a medida que 
subimos pela escada evolutiva. Nao é a toa que as células 
fusiformes, que lidam com emocoes e juizos morais, tenham 
essa forma de conectividade, tendo em vista a capacidade 
das reacdes emocionais de nivel superior para tocarem em 
diversos té6picos e pensamentos. Em funcao de seus vinculos 
com varias outras partes do cérebro, aS emocoes de nivel 
superior processadas pelas células fusiformes sao afetadas 
por todas as nossas regides perceptivas e cognitivas. E 
importante destacar que essas célulaS nao resolvem 
problemas racionais, motivo pelo qual nao temos controle 
racional das nossas reacgdes a musicas ou paixdes. O resto do 
cérebro, porém, esta firmemente envolvido na tentativa de 
entender nossas misteriosas emocoes de nivel superior. 


A quantidade de células fusiformes é relativamente 
pequena: apenas umas 80 mil, com cerca de 45 mil no 
hemisfério direito e 35 mil no esquerdo. Essa disparidade 6, 
no minimo, um dos motivadores da ideia de que a 
intelig@ncia emocional pertence ao dominio do hemisfério 
direito, apesar de a desproporcao ser modesta. Gorilas tém 
cerca de 16 mil dessas células; bonobos, umas 2.100 e 
chimpanzés, cerca de 1.800. Outros mamiferos nao tém 
nenhuma. 

Os antropdlogos acreditam que as células fusiformes 
apareceram pela primeira vez entre 10 e 15 milhdes de anos 
atras num ancestral comum - e ainda nao descoberto - entre 
simios e hominideos (precursores dos humanos), e sua 
quantidade aumentou rapidamente ha cerca de 100 mil 
anos. E interessante observar que as Ccélulas fusiformes nao 
existem em humanos recém-nascidos, e sO comecam a 
aparecer na idade aproximada de 4 meses; depois, seu 
numero aumenta significativamente entre 1 e 3 anos de 
idade. A capacidade da crianca para lidar com questoes 
morais e perceber emocoes de nivel superior, como o amor, 
é desenvolvida nesse mesmo periodo. 


Aptidao 

Wolfgang Amadeus Mozart (1756-1791) escreveu um 
minueto aos 5 anos. Com 6, tocou para a imperatriz Maria 
Teresa na corte imperial em Viena. Depois, compés 600 
pecas, incluindo 41 sinfonias, antes de sua morte aos 35 
anos, e € considerado por muitos 0 maior compositor na 
tradi¢ao europeia classica. Podemos dizer que ele tinha 
aptidao para a musica. 


E o que isso significa no contexto da teoria da mente 
baseada no reconhecimento de padrées? E claro que parte 
daquilo que consideramos aptidao é fruto de aprendizagem, 
ou seja, influ€ncia do ambiente e de outras pessoas. Mozart 
nasceu numa familia musical. Seu pai, Leopold, era 
compositor e kapellmeister (literalmente, lider musical) da 
orquestra da corte do arcebispo de Salzburgo. O jovem 
Mozart estava mergulhado na musica, e seu pai cComecou a 
Ihe ensinar violino e clavicérdio (instrumento de teclas) aos 
3 anos. 

Entretanto, apenas as_ influ€ncias ambientais nao 
explicam plenamente o génio de Mozart. E claro que 
também existe um componente natural. Que forma ele tem? 
Como escrevi no capitulo 4, regides diferentes do neocdrtex 
tornaram-se otimizadas (pela evolucao bioldgica) para 
certos tipos de padroes. Embora o algoritmo basico de 
reconhecimento de padroes dos mddulos seja uniforme ao 
longo do neocértex, como certos tipos de padrao tendem a 
fluir por certas regides (rostos pelo giro fusiforme, por 
exemplo), essas regides tornam-se melhores no que se refere 
ao processamento de padroes associados. Contudo, ha 
numerosos parametros que governam o modo como o 
algoritmo 6 efetivamente processado em cada modulo. Por 
exemplo, para ser reconhecido, quao similar deve ser um 
padrao? Como esse limiar @€ modificado se um modulo de 
nivel superior envia o sinal de que seu padrao é “esperado”? 
Como sao levados em conta os parametros de tamanho? 
Esses e outros fatores foram dispostos diferentemente em 
regides diferentes para serem vantajosos para _ tipos 
especificos de padrao. Em nosso trabalho com métodos 
similares na inteligéncia artificial, percebemos o mesmo 


fendmeno e usamos simulacoes de evolucao para otimizar 
esses parametros. 

Se regides especificas podem ser otimizadas para tipos 
diferentes de padr6ées, entao decorre que havera variacées 
Na capacidade de cada cérebro aprender, identificar e criar 
certos tipos de padrao. Por exemplo, um cérebro pode ter 
aptidao inata para musica porque consegue identificar 
melhor padroes_ ritmicos, ou compreende melhor a 
disposi¢ao geométrica das harmonias. O fenédmeno do 
ouvido absoluto (a capacidade de identificar e de reproduzir 
um tom sem referéncia externa), correlacionado com o 
talento musical, parece ter base genética, embora essa 
habilidade precise ser desenvolvida; por isso, € provavel que 
seja uma combinacao entre natureza e aprendizado. E 
provavel que a base genética do ouvido absoluto resida fora 
do neocortex, no pré-processamento da informacao auditiva, 
enquanto o aspecto cultivado reside no neocortex. 

Ha outras habilidades que contribuem para o grau de 
competéncia, seja do tipo rotineiro, seja do génio lendario. 
Habilidades neocorticais - por exemplo, a capacidade do 
neocortex para dominar os sinais de medo que a amigdala 
gera (quando se vé diante de uma reprovacao) - teém um 
papel significativo, assim como atributos do tipo confianca, 
talento organizacional e capacidade de influenciar os outros. 
Uma habilidade muito importante que percebi antes é a 
coragem de se devotar a ideias que vao contra a tendéncia 
da ortodoxia. Invariavelmente, pessoas que consideramos 
geniais fizeram experimentos mentais de maneiras que nao 
foram compreendidas ou apreciadas no inicio por seus pares. 
Apesar de Mozart ter sido reconhecido em vida, a maior 
parte da adulacao veio depois. Ele morreu na miséria, foi 


enterrado numa vala comum e so dois outros musicos 
compareceram ao seu funeral. 


Criatividade 


Criatividade 6 uma droga sem a qual nao consigo viver. 
- Cecil B. DeMille 


O problema nunca esta em gerar pensamentos novos ou inovadores 
na mente, mas em como extrair dela os antigos. Cada mente & um 
edificio repleto de méveis arcaicos. Limpe um canto de sua mente e 
a criatividade 0 ocupara no mesmo instante. 

- Dee Hock 


A humanidade pode ser bem fria para com aqueles cujos olhos 
veem o mundo de forma diferente. 
- Eric A. Burns 


A criatividade pode resolver quase todos os problemas. O ato 
criativo, a derrota do habito pela originalidade, supera tudo. 
- George Lois 


Um aspecto importante da criatividade € 0 processo de 
encontrar grandes metaforas - simbolos que representam 
outra coisa. O neocdrtex € uma grande maquina de 
metaforas, 0 que explica por que somos uma espécie 
singularmente criativa. Cada um dos 300 milhdoes de 
identificadores de padrées do neocortex esta identificando e 
definindo um padrao e dando-lhe um nome, que, no caso 
dos modulos neocorticais de reconhecimento de padroées, é 
nada mais que o axOdnio que surge do identificador de 
padroes acionado quando esse padrao é encontrado. Esse 
simbolo, por sua vez, torna-se parte de outro padrao. 
Basicamente, cada um desses padréoes € uma metafora. Os 
identificadores podem disparar até cem vezes por segundo, 


e por isso temos o potencial de identificar até 30 bilhées de 
metaforas por segundo. Naturalmente, nem todos os 
mddulos disparam a cada ciclo, mas é valido dizer que, de 
fato, estamos identificando milhdes de metaforas a cada 
segundo. 

Naturalmente, algumas metaforas sao mais significativas 
do que outras. Darwin percebeu que o /nsight de Charles 
Lyell sobre 0 modo como mudancas muito graduais num 
filete de agua podem esculpir imensos canions era uma 
metafora poderosa para 0 modo como um filete de pequenas 
mudancas evolutivas ao longo de milhares de geracoes 
podia esculpir grandes mudancgas na diferenciagcao das 
espécies. Experimentos mentais, como aquele que Einstein 
usou para revelar o verdadeiro significado do experimento 
de Michelson-Morley, sao metaforas, no sentido de ser uma 
“coisa considerada representativa ou simbdlica de outra”, 
para usar uma definicao de dicionario. 

Vocé vé metaforas no Soneto 73 de Shakespeare? 


Uma estacao - o outono - em mim tu podes ver: 
Ja a folhagem 6 rara, ou nula, ou amarelada, 
Nos ramos que gelado vento vem bater, 

Coros em ruina, onde cantava a passarada. 


Em mim contemplas o clarao crepuscular, 
Quando no ocaso, posto o sol, se esvai O dia: 
Segunda morte, que faz tudo repousar, 
Agora mesmo o levarda noite sombria. 


Em mim divisas uma chama a fulgurar 
Nas cinzas de uma juventude ja perdida, 
Como em leito final onde haja de expirar 


S6 por aguilo que a nutria consumida 
Isso 6 o que vés, e teu amor fica mais forte, 
Para amar o que logo perderas na morte. 


Neste soneto, o poeta usa diversas metaforas para 
descrever a idade que avancava. Sua idade € como o final 
do outono, quando “a folhagem é rara, ou nula, ou 
amarelada”. O clima é frio e as aves nao pousam mais nos 
galhos, que ele chama de “coros em ruina”. Sua idade é 
como o crepusculo, “quando no ocaso, posto o sol, se esvai o 
dia”. Ele € o resto de uma fogueira “nas cinzas de uma 
juventude ja perdida”. De fato, toda a linguagem é, em 
ultima analise, metafora, embora algumas de_ suas 
expressdes sejam mais memoraveis do que outras. 

Encontrar uma metafora 6 0 processo de identificar um 
padrao apesar das diferencas em detalhes e contexto - uma 
atividade que realizamos trivialmente a cada momento de 
nossas vidas. Os saltos metafdricos que consideramos 
importantes costumam acontecer nos_ intersticios de 
disciplinas diferentes. Trabalhando contra essa_ forca 
essencial da _ criatividade, porém, esta a_tendéncia 
Onipresente de uma especializagao cada vez maior nas 
ci€ncias (e também em quase todos os outros campos). 
Como escreveu o matematico norte-americano Norbert 
Wiener (1894-1964) em seu seminal livro Cybernetics, 
publicado no ano em que nasci (1948): 


Ha campos do trabalho cientifico, como veremos no corpo deste 
livro, que foram explorados sob as facetas da matematica pura, da 
estatistica, da engenharia elétrica e da neurofisiologia, nas quais 
cada conceito recebe um nome separado de cada grupo, e nas quais 
cada trabalho importante foi triplicado ou quadruplicado, enquanto 
outros trabalhos importantes sao retardados pela indisponibilidade, 


num dos campos, de resultados que podem ja ter se tornado 
classicos em outro campo. 

Essas regides fronteirigas sao as que oferecem as oportunidades 
mais ricas para o investigador qualificado. Sao, ao mesmo tempo, as 
mais refratarias as técnicas aceitas de ataque em massa e a divisao 
do trabalho. 


Uma técnica que tenho usado em meu proprio trabalho 
para combater a especializagao crescente @€ reunir os 
especialistas que selecionei para um projeto (por exemplo, 
meu trabalho de reconhecimento de fala incluiu cientistas 
da fala, linguistas, psicoacusticos e especialistas em 
reconhecimento de padroes, além de _ cientistas da 
computacao), estimulando cada um a ensinar ao grupo suas 
técnicas e terminologia especificas. Depois, descartamos 
toda essa terminologia e criamos a _ nossa_ propria. 
Invariavelmente, encontramos metaforas de um campo que 
solucionam problemas em outro. 

Um camundongo que encontra uma rota de fuga quando 
se defronta com um gato doméstico - e consegue fazé-lo 
mesmo se a situacao for um pouco diferente de outras em 
que ja se viu - esta sendo criativo. Nossa criatividade é 
muitas vezes maior que a do camundongo - e envolve 
muitos mais niveis de abstragcao - porque temos um 
neocortex muito maior, capaz de niveis bem maiores de 
hierarquia. Assim, um caminho para se obter uma 
criatividade maior consiste em agregar mais neocortex de 
maneira eficiente. 

Uma forma de expandir o neocértex disponivel é€ pela 
colaboragao de diversos seres humanos. Isso é€ feito 
rotineiramente através da comunicacao entre pessoas 
reunidas numa comunidade que resolve’ problemas. 
Recentemente, fizeram-se esforcos para usar ferramentas de 


colaboracao on-line para controlar o poder da colaboracao 
em tempo real, uma abordagem que obteve sucesso na 
matematica e em outros campos [1]. 

O passo seguinte, naturalmente, seria a expansao do 
proprio neocdértex com seu equivalente nao bioldgico. Esse 
sera nosso ato supremo de criatividade: criar a capacidade 
para ser criativo. O neocdrtex nao biolégico sera mais rapido 
e€ capaz de buscar com agilidade os tipos de metaforas que 
inspiraram Darwin e- Einstein. Ele pode explorar 
sistematicamente todos os limites superpostos entre nossas 
fronteiras de conhecimento, que crescem 
exponencialmente. 

Algumas pessoas expressam preocupacao sobre o que 
acontecera com aqueles que optarem por nao participar 
dessa expansao mental. Eu diria que essa inteligéncia 
adicional vai residir basicamente na nuvem (a rede de 
computadores em crescimento exponencial a qual nos 
conectamos através da comunicac¢ao on-line), na qual a 
maior parte da intelig€ncia de nossas maquinas esta 
armazenada. Quando vocé utiliza um _ sistema de 
reconhecimento de fala no celular, consulta um assistente 
virtual como Siri ou usa o telefone para traduzir um signo 
para outra linguagem, a inteligéncia nao esta no aparelho 
em si, Mas na nuvem. Nosso neocoértex expandido também 
estara armazenado la. Se acessamos essa _inteligéncia 
expandida através de conexdes neurais diretas ou pelo 
modo como fazemos hoje - interagindo com ela através de 
nossos aparelhos - 6 uma distingao arbitraria. Em meu ponto 
de vista, todos nds nos tornaremos mais criativos através 
desse refor¢o onipresente, quer optemos ou nao pela 
conexao direta com a_ inteligéncia expandida da 
humanidade. Ja terceirizamos boa parte de nossa memoria 


pessoal, social, histérica e cultural na nuvem, e, em Ultima 
analise, faremos a mesma coisa com nosso pensamento 
hierarquico. 

O grande avanco de Einstein resultou nao sé de sua 
aplicacao de metaforas através de experimentos mentais, 
mas também de sua coragem em acreditar no poder dessas 
metaforas. Ele estava disposto a abrir mao das explicacdes 
tradicionais que nao satisfaziam seus experimentos, e a 
Suportar as piadas de seus colegas com relacao as 
explicacdes bizarras que suas metaforas implicavam. Essas 
qualidades - a crenca na metafora e a coragem das proprias 
conviccdes - sao valores que também deveriamos poder 
programar em nosso neocortex nao bioldgico. 


Amor 


A clareza mental também significa a clareza da paixao; 6 por isso 
que uma mente grandiosa e clara ama ardentemente e vé de forma 
distinta aquilo que ama. 

- Blaise Pascal 


Ha sempre certa loucura no amor. Mas também ha sempre alguma 
razao na loucura. 
- Friedrich Nietzsche 


Quando vocé ja tiver visto tanta coisa na vida quanto eu, nao vai 

subestimar o poder do amor obsessivo. 
- Alvo Dumbledore, de J. K. Rowling, em Harry Potter e o Enigma do 
Principe 


Sempre gosto de uma boa solucado matematica para qualquer 

problema amoroso. 

- Michael Patrick King, do episddio “De volta ao jogo” de Sex and the 
City 


Se vocé nunca experimentou de fato um amor arrebatador, 
sem duvida deve ter ouvido falar dele. E justo dizer que uma 
fragao substancial, se nao a maioria da arte mundial - 
historias, romances, musicas, dancas, pinturas, séries da 
televisao e filmes - se inspira nas hist6rias do amor em seus 
primeiros estagios. 

Recentemente, a ciéncia também entrou em cena, e 
agora podemos identificar as mudancas bioquimicas que 
acontecem quando alguém_ se_= apaixona.  Libera-se 
dopamina, produzindo sensacoes como felicidade e deleite. 
Os niveis de norepinefrina sobem, o que leva a aceleracao 
dos batimentos cardiacos e a uma sensacao generalizada de 
euforia. Essas substancias quimicas, juntamente com a 
feniletilamina, produzem exaltacao, niveis elevados de 
energia, atencao focalizada, perda de apetite e um anseio 
geral pelo objeto do desejo. E interessante comentar que 
pesquisas recentes da University College de Londres 
também mostram que os niveis de serotonina se reduzem, 
tal como ocorre em transtornos obsessivo-compulsivos, o 
que é consistente com a natureza obsessiva do amor 
incipiente [2]. Os elevados niveis de dopamina e 
norepinefrina explicam o aumento da atencao de curto 
prazo, da euforia e do anseio, sentidos durante 0 comeco de 
um amor. 

Se esses fendmenos bioquimicos parecem semelhantes 
aos da sindrome de lutar ou fugir, 6 porque sao, sd que 
neste caso estamos correndo para alguém ou alguma coisa; 
com efeito, um cinico poderia dizer que estamos rumando 
para oO perigo, e nao para longe dele. As mudancas também 
estao plenamente consistentes com aquelas das primeiras 
fases do comportamento viciante. A cancao “Love Is the 


Drug” [O amor é a droga], da banda Roxy Music, € bem 


precisa na descri¢ao desse estado (embora o sujeito da 
cancao esteja procurando conquistar sua proxima amada). 
Estudos sobre experiéncias de éxtase religioso também 
mostram os mesmos fendmenos psiquicos; podemos dizer 
que a pessoa que tem uma experiéncia dessas esta se 
apaixonando por Deus ou por alguma conexao espiritual que 
tenha. 

No caso do amor romantico incipiente, com certeza o 
estrogénio e a testosterona t@ém seu papel na formacao do 
impulso sexual, mas se a reproducao sexual fosse o Unico 
objetivo evolutivo do amor, entao o aspecto romantico do 
processo nao seria necessario. Como escreveu o psicdlogo 
John William Money (1921-2006), “a luxuria é lUbrica, o 
amor é lirico”. 

A fase extatica do amor leva a fase do apego e, no final, a 
um vinculo de longo prazo. Também ha_ substancias 
quimicas que estimulam esse processo, inclusive a oxitocina 
e€ a vasopressina. Veja 0 caso de duas espécies aparentadas 
de roedores: oO arganaz-das-pradarias e€ oO arganaz-da- 
montanha. Sao praticamente idénticos, s6 que o arganaz- 
das-pradarias tem receptores para oxitocina e vasopressina, 
enquanto o arganaz-da-montanha nao tem. O arganaz-das- 
pradarias é famoso por seus relacionamentos monogamicos 
vitalicios, enquanto o arganaz-da-montanha dedica-se quase 
que somente a encontros fugazes. No caso dos arganazes, os 
receptores para oxitocina e vasopressina sao determinadores 
da natureza de sua vida amorosa. 

Embora essas substancias quimicas também influenciem 
os seres humanos, nosso neocdrtex assumiu o papel de 
comando, como em tudo que fazemos. Os arganazes 
também tém neocdrtex, mas ele € do tamanho de um selo e 
plano, e tem apenas o tamanho necessario para que 


encontrem uma parceira para o resto da vida (ou, no caso do 
arganaz-da-montanha, pelo menos por uma noite) e para 
levar a cabo outros comportamentos basicos dos arganazes. 
Noés, humanos, temos neocértex adicional suficiente para 
nos dedicar as vastas expressdes “liricas” a que Money se 
refere. 

Do ponto de vista evolutivo, 0 préprio amor existe para 
atender as necessidades do neocértex. Se nao tivéssemos 
um neocortex, entao a luxuria seria razoavelmente 
suficiente para assegurarmos a reproducao. A instigacao 
extatica do amor leva a ligacao e ao amor maduro, 
resultando num vinculo duradouro. Este, por sua vez, visa 
proporcionar ao menos a possibilidade de um ambiente 
estavel para os filhos, enquanto seus neocortices passam 
pelo aprendizado critico necessario para que se tornem 
adultos responsaveis e capazes. O aprendizado num 
ambiente rico @ uma parte intrinseca do método do 
neocortex. De fato, os mesmos mecanismos hormonais da 
oxitocina e da vasopressina desempenham um papel crucial 
na formacao de um vinculo critico entre os progenitores 
(especialmente a mae) e os filhos. 

No outro extremo da histdéria do amor, o ente querido 
torna-se uma parte importante de nosso neocdértex. Apds 
décadas de uniao, existe a presenca virtual do outro no 
neocortex, a ponto de podermos antever cada etapa daquilo 
que o ente querido vai dizer e fazer. Nossos padroes 
neocorticais estao tomados por pensamentos e padroes que 
refletem quem ele é. Quando perdemos essa _ pessoa, 
perdemos literalmente parte de nds mesmos. Isso nao é 
apenas uma metafora: todos os numerosos identificadores 
de padroes tomados pelos padroes que refletem a pessoa 
que amamos mudam subitamente de natureza. Apesar de 


poderem ser considerados um modo precioso de mantermos 
a pessoa viva em nos mesmos, os inumeros padroes 
neocorticais de um ente querido que se foi passam 
subitamente de ativadores do deleite para ativadores do 
luto. 

A base evolutiva para o amor e suas fases nao é a historia 
completa do mundo atual. Ja fomos razoavelmente bem- 
sucedidos na desvinculag¢ao entre o sexo e sua funcao 
bioldgica, pois podemos ter bebés sem fazer sexo e 
certamente podemos ter o ato sexual sem bebés. Na maioria 
das vezes, 0 sexo acontece com propdositos sensuais e de 
relacionamento. E rotineiramente nos apaixonamos com 
propositos que nao a procriacao. 

De modo similar, a enorme quantidade de expressdoes 
artisticas de todos os tipos que celebram o amor e suas 
milhares de formas, datando da antiguidade, também é um 
fim em si mesmo. Nossa capacidade de criar essas formas 
duradouras de conhecimento transcendente - sobre o amor 
ou qualquer outra coisa - é justamente o que torna Unica a 
nossa espécie. 

O neocortex 6 a maior criacao da biologia. Por sua vez, 
SaO OS poemas sobre o amor - e todas as nossas outras 
criagoOes - que representam as maiores invencgoes de nosso 
neocortex. 


¢ Capitulo 7 « 


O neocortex digital inspirado na biologia 


Nunca confie em qualquer coisa que pensa por si mesma se vocé 

nao puder ver onde ela guarda o cérebro. 

- Arthur Weasley, de J. K. Rowling, em Harry Potter e o Prisioneiro de 
Azkaban 


Nao, eu nao estou interessado em desenvolver um _ cérebro 
poderoso. Estou interessado num cérebro mediocre, algo como o 
presidente da American Telephone and Telegraph Company. 

- Alan Turing 


Um computador merece ser chamado de _ inteligente quando 
consegue fazer um humano acreditar que ele 6 humano. 
- Alan Turing 


Creio que, no final do século, o uso de palavras e a opiniao geral das 
pessoas educadas terao sido tao alterados que seremos capazes de 
falar de maquinas pensantes sem esperarmos que nos contradigam. 

- Alan Turing 


ma mae camundongo constréoi um ninho para seus 
filhotes mesmo sem nunca ter visto outro camundongo 
em sua vida [1]. De modo analogo, uma aranha tece uma 
teia, uma lagarta cria seu prdprio casulo e um castor 
constrdéi um dique, mesmo que nenhum contemporaneo Ihes 
mostre como realizar essas tarefas complexas. ISso nao quer 


dizer que nao sejam comportamentos aprendidos. E que 
esses animaiS nao os aprenderam numa Unica existéncia - 
eles oS aprenderam ao longo de milhares de existéncias. A 
evolugao do comportamento animal constitui um processo 
de aprendizado, mas um aprendizado da espécie e nao do 
individuo, e os frutos desse processo de aprendizado estao 
codificados no DNA. 

Para entender a importancia da evolucao do neocortex, 
pense que ele acelerou muito o processo de aprendizado 
(conhecimento hierarquico), de milhares de anos para meses 
(ou menos). Mesmo que milhoOes de animais de uma 
determinada espécie de mamiferos nao tenham conseguido 
solucionar um problema (que exige uma hierarquia de 
etapas), foi necessario que apenas um tenha encontrado 
acidentalmente uma solucao. Esse novo método seria entao 
copiado e espalhado exponencialmente pela populacao. 

Estamos agora em posicao de acelerar novamente o 
processo de aprendizado num fator de milhares ou de 
milhoes, migrando da intelig@éncia biolédgica para a nao 
bioldgica. Quando um neocértex digital aprende uma 
habilidade, ele pode transferir esse know-how em minutos 
ou até em segundos. Como um dos muitos exemplos, em 
minha primeira empresa, a Kurzweil Computer Products 
(hoje Nuance Speech Technologies), que fundei em 1973, 
passamos anos treinando um conjunto de computadores de 
pesquisa para identificarem letras impressas em 
documentos escaneados, uma_ tecnologia chamada 
reconhecimento optico de caracteres onifonte (qualquer tipo 
de fonte), conhecida como OCR. Essa tecnologia especifica 
vem sendo desenvolvida continuamente ha quase 40 anos; 
oO produto atual € chamado OmniPage da Nuance. Se vocé 
quiser que seu computador identifique letras impressas, nao 


precisa passar anos treinando-o para isso, tal como fizemos: 
vocé pode simplesmente baixar os padroes evoluidos ja 
aprendidos pelos computadores de pesquisa na forma de 
software. Na década de 1980, comecamos a trabalhar com o 
reconhecimento de fala, e essa tecnologia, que vem sendo 
desenvolvida ha varias décadas, faz parte do Siri. Mais uma 
vez, vocé pode baixar em segundos os padrées evoluidos 
aprendidos por computadores de pesquisa ao longo de 
muitos anos. 

Em ultima analise, vamos criar um neocortex artificial 
que tem a flexibilidade e a gama completa de seu 
equivalente humano. Pense nos_ beneficios. Circuitos 
eletr6nicos sao milhdes de vezes mais rapidos do que nossos 
circuitos bioldgicos. No inicio, teremos de dedicar todo esse 
ganho em velocidade para compensar a relativa falta de 
paralelismo em nossos computadores, mas, no final, o 
neocortex digital sera bem mais veloz do que a variedade 
bioldgica, e sua velocidade s6 tende a aumentar. 

Quando ampliamos nosso proprio neocdértex com uma 
versao sintética, nao temos de nos preocupar com quanto 
neocortex adicional pode ser acomodado fisicamente em 
nossos corpos e cérebros, pois a maior parte dele estara na 
nuvem, como a maior parte dos computadores que usamos 
hoje. Antes, estimei que temos em torno de 300 milhdes de 
identificadores de padroes em nosso neocortex bioldgico. 
Isso 6 tudo que podia caber em nosso cranio, mesmo com a 
inovacao evolutiva de uma testa ampla e com o neocoértex 
ocupando cerca de 80% do espaco disponivel. Assim que 
comecarmos a pensar através da nuvem, nao havera limites 
naturais; seremos capazes de usar bilhdes ou trilhoes de 
identificadores de padrées, basicamente o numero que 


quisermos, dependendo do que a lei dos retornos acelerados 
puder proporcionar a cada unidade de tempo. 

Para que um neocortex digital possa aprender uma nova 
habilidade, ele ainda vai exigir muitas iteragoes educativas, 
assim como o neocortex biolégico, mas depois que uM Unico 
neocortex digital, em algum lugar e momento, aprende 
alguma coisa, ele pode compartilhar esse conhecimento com 
todos os outros neocortices digitais sem demora. Cada um 
pode ter seus proprios extensores de neocortex particulares 
na nuvem, assim como  temos_ nossos _ prodprios 
armazenadores particulares de dados pessoais. 

Por ultimo, mas nao menos importante, seremos capazes 
de criar uma copia de seguranca da porcao digital de nossa 
intelig@ncia. Como vimos, nao € apenas uma metafora 
afirmar que nosso neocortex contém informacodes, e é 
assustador pensar que nenhuma dessas informacoes esta 
duplicada atualmente. E claro que ha um modo de criar uma 
copia da informacao contida no cérebro: escrevendo-a. A 
Capacidade de transferir pelo menos parte de nosso 
pensamento para um meio que pode durar mais do que 
nossos corpos biolégicos foi um imenso avanco, mas muitos 
dados em nosso cérebro ainda estao vulneraveis. 


Simulacoes de cérebros 


Uma forma de construir um cérebro digital @ simular 
precisamente um bioldgico. Para citar um exemplo, o 
doutorando em ciéncias cerebrais David Dalrymple (nascido 
em 1991) esta planejando simular o cérebro de um 
nematddeo (um verme cilindrico [2]). Dalrymple escolheu o 
nematddeo por causa de seu sistema nervoso relativamente 
simples, que consiste em cerca de 300 neurénios, e que ele 


planeja simular ao nivel bem detalhado das moléculas. Ele 
também vai criar uma simulacao computadorizada de seu 
corpo e de seu ambiente, para que seu nematddeo virtual 
possa cacar alimento (virtual) e fazer as outras coisas que os 
nematddeos sabem fazer melhor. Dalrymple diz que é 
provavel que seja a primeira carga transferida de um animal 
bioldgico para um virtual, vivendo num mundo virtual. Como 
seu nematddeo simulado, saber se até os nematddeos 
bioldgicos tém consciéncia é algo aberto a diScuss6ées, 
embora, ao lutarem para comer, digerir alimentos, evitar 
predadores e se reproduzir, eles tenham experiéncias das 
quais sao conscientes. 

Do lado oposto do espectro, o Projeto Blue Brain, de 
Henry Markram, esta planejando simular o cérebro humano, 
inclusive todo o neocdrtex e as regides do cérebro primitivo 
como o hipocampo, a amigdala e o cerebelo. Suas 
simulacgdes planejadas serao construidas com graus variados 
de detalhamento, até uma simulagao completa em nivel 
molecular. Como disse no capitulo 4, Markram descobriu um 
moddulo-chave com varias dezenas de neurdnios que se 
repete sempre no neocortex, demonstrando que o 
aprendizado é feito por esses mdédulos e nao por neurdnios 
isolados. 

O progresso de Markram tem aumentado num ritmo 
exponencial. Ele simulou um neurénio em 2005, ano em que 
O projeto comecou. Em 2008, sua equipe simulou toda uma 
coluna neocortical do cérebro de um rato, consistindo em 10 
mil neurénios. Em 2011, o numero tinha se expandido para 
cem colunas, totalizando um milhao de células, que ele 
chamou de mesocircuito. Uma controvérsia relativa ao 
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trabalho de Markram € o modo de verificar se suas 


simulacgdes sao precisas. Para isso, essas simulagoes vao 
precisar demonstrar seu aprendizado, o que discuto a seguir. 

Ele planeja similar um cérebro de rato completo com cem 
mesocircuitos, totalizando 100 milhdes de neurdnios e cerca 
de um trilhao de sinapses, por volta de 2014. Numa palestra 
na conferéncia TED de 2009 em Oxford, Markram disse: 
“Nao é impossivel construir um cérebro humano, e podemos 
fazé-lo em_10 anos [3]”. Sua meta mais recente para a 
simulacgao de um cérebro completo é 2023 [4]. 

Markram e sua equipe estao baseando seu modelo em 
detalhadas analises anatémicas e eletroguimicas de 
neurdénios de verdade. Usando um aparato automatico que 
criaram, chamado rob6é de fixagao de membranas [patch- 
clamp robot], eles estao medindo enzimas, canais iénicos e 
neurotransmissores especificos responsaveis pela atividade 
eletroquimica dentro de cada neurdnio. Seu sistema 
automatico conseguiu realizar 30 anos de analises em seis 
meses, segundo Markram. Foi a partir dessas analises que 
eles perceberam as unidades de “memoria Lego”, que sao as 
unidades funcionais basicas do neocortex. 
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Progresso real e projetado do projeto de simulacao cerebral Blue Brain 


Contribui¢does significativas para a tecnologia da fixagao 
robdética de membranas [robotic patch-clamping] foram 
feitas por Ed Boyden, neurocientista do MIT, Craig Forest, 
professor de engenharia mecanica da Georgia Tech, e 
Suhasa Kodandaramaiah, orientando de Forest na _ pos- 
graduacao. Eles demonstraram um sistema automatizado 
com precisao de um micrémetro que pode realizar a 
varredura de tecidos neurais a uma distancia muito curta 
sem danificar as delicadas membranas dos neurénios. “Isso 
€ uma coisa que um robo pode fazer e um humano nao”, 
comentou Boyden. 

Voltando a simulacao de Markram, depois de simular uma 
coluna neocortical, Markram teria dito: “Agora s6 precisamos 
ampliar_a_escala [5]”. Com certeza, a escala é um fator 
importante, mas resta maiS um obstaculo importante: o 
aprendizado. Se o cérebro do Projeto Blue Brain deve “falar, 


ter uma inteligéncia e comportar-se de forma bem parecida 
com a de um humano”, que foi como Markram descreveu 
sua meta numa entrevista para a BBC em 2009, entao ele 
precisara de conteudo suficiente em seu neocdrtex simulado 
para realizar . Como qualquer um que tenha 
tentado manter uma conversa com um recém-nascido pode 
confirmar, € preciso aprender muito antes que isso se torne 
viavel. 





A ponta do robé de fixagdo de membranas desenvolvido no MIT e na Georgia 
Tech fazendo a varredura de tecidos neurais 


Ha duas maneiras Oobvias pelas quais isso pode ser feito 
num cérebro simulado como o Blue Brain. Uma seria fazer 
com que o cérebro aprendesse o conteudo tal como um 
cérebro humano o faz. Ele pode comecar como um bebé 
humano recém-nascido, com a capacidade inata de adquirir 


conhecimento hierarquico, e com certas transformacoes pré- 
programadas em suas regides de _ pré-processamento 
sensorial. Mas o aprendizado que ocorre entre um bebé 
bioldgico e um ser humano que pode conversar com ele 
precisaria se dar de maneira comparavel no aprendizado 
nao biolédgico. O problema dessa abordagem é€ que um 
cérebro que esta sendo simulado no nivel de detalhes 
esperado para o Blue Brain so deve funcionar em tempo real 
no inicio da década de 2020. Até o funcionamento em 
tempo real seria demasiadamente lento, a menos que os 
pesquisadores estejam preparados para aguardar uma ou 
duas décadas até se atingir a paridade intelectual com um 
humano adulto, embora o desempenho em tempo real va 
ficando cada vez mais rapido a medida que _ os 
computadores continuam a aumentar em 
preco/desempenho. 

A outra abordagem consiste em fazer com que um ou 
mais cérebros humanos biolédgicos que ja adquiriram 
conhecimento' suficiente conversem numa_ linguagem 
significativa e se comportem de forma madura, copiando 
seus padroes neocorticais para o cérebro simulado. O 
problema desse método € que exige uma tecnologia nao 
invasiva e nao destrutiva, com resolucao espacial e temporal 
e velocidade suficiente para realizar tal tarefa de maneira 
rapida e completa. Imagino que essa tecnologia de 
“uploading” nao esteja disponivel antes da década de 2040. 
(As exigéncias computacionais para simular um cérebro com 
esse grau de precisao, que estimo que seja da ordem de 
1019 calculos por segundo, estarao disponiveis num 
supercomputador, segundo minhas projecdes, no inicio da 
década de 2020; no entanto, as tecnologias de varredura 
cerebral nao destrutivas vao demorar mais.) 


Ha uma terceira abordagem, que é aquela que, segundo 
acredito, projetos de simulacao como o Blue Brain precisarao 
adotar. Podemos simplificar modelos moleculares criando 
equivalentes funcionais em _ diferentes niveis de 
especificidade, que vao desde meu proprio método 
algoritmico funcional (como descrito neste livro) até 
simulagdes que se aproximam mais de_ simulacoes 
moleculares plenas. A velocidade de aprendizado, portanto, 
pode ser aumentada por um fator de centenas ou de 
milhares, dependendo do grau de simplificacao utilizado. E 
possivel idealizar um programa educacional para o cérebro 
simulado (usando o modelo funcional) que ele pode 
aprender de forma relativamente rapida. Entao, a simulacao 
molecular plena pode ser _ substituida pelo modelo 
simplificado, mas ainda usando seu aprendizado acumulado. 
Depois, podemos simular o aprendizado com o modelo 
molecular pleno numa velocidade muito mais lenta. 

Dharmendra Modha,_ cientista norte-americano da 
computacao, e seus colegas da IBM criaram uma simulacao, 
célula por célula, de uma porcao do neocortex visual 
humano compreendendo 1,6 bilhao de neurénios virtuais e 9 
trilhdes de sinapses, 0 que equivale ao neocdértex de um 
gato. Ele funciona cem vezes mais lentamente do que o 
tempo real num supercomputador IBM BlueGene/P, que 
consiste em 147.456 processadores. O trabalho recebeu o 
Prémio Gordon Bell da Association for Computing Machinery. 

O propdsito especifico de um projeto de simulacao 
cerebral como o Blue Brain e as simulacd6es de neocértex de 
Modha @€ aprimorar e confirmar um modelo funcional. No 
nivel humano, a IA vai usar principalmente o tipo de modelo 
algoritmico funcional discutido neste livro. No entanto, as 
simulacoes moleculares vao nos ajudar a aperfeicoar esse 


modelo e a compreender plenamente quais sao os detalhes 
importantes. Quando desenvolvi a_ tecnologia de 
reconhecimento de fala nas décadas de 1980 e 1990, 
conseguimos aprimorar nossos algoritmos depois que as 
transformac6es reais realizadas pelo nervo auditivo e pelas 
primeiras porcoes do cértex auditivo foram compreendidas. 
Mesmo que nosso modelo funcional seja_ perfeito, 
compreender exatamente como ele sera efetivamente 
implementado em nossos cérebros biolégicos vai revelar 
conhecimentos importantes sobre funcgoes e disfuncoes 
humanas. 

Vamos precisar de dados detalhados sobre cérebros reais 
para criar simulagoes com base bioldgica. A equipe de 
Markram esta reunindo seus prdéprios dados. Ha projetos em 
grande escala para coletar esse tipo de dados e 
disponibiliza-los para cientistas. Para citar um exemplo, o 
Cold Spring Harbor Laboratory de Nova York coletou 500 
terabytes de dados mapeando o cérebro de um mamifero 
(um camundongo), que disponibilizaram em junho de 2012. 
Seu projeto permite que o usuario explore um cérebro, tal 
como o Google Earth permite explorar a superficie do 
planeta. E possivel se movimentar ao redor do cérebro e dar 
um zoom para ver neur6nios individuais e suas conexées. E 
possivel destacar uma Unica conexao e acompanhar seu 
caminho pelo cérebro. 

Dezesseis secoes dos Institutos Nacionais da Saude dos 
Estados Unidos (National Institutes of Health) se reuniram e 
patrocinaram uma iniciativa importante chamada Human 
Connectome Project, com verbas de US$ 38,5 milhdes [7]. 
Liderado pela Universidade de Washington em St. Louis, a 
Universidade de Minnesota, a Universidade de Harvard, o 
Hospital Geral de Massachusetts e a Universidade da 


Califérnia em Los Angeles, o projeto busca criar um mapa 
tridimensional similar de conexdes no cérebro humano. O 
projeto esta usando diversas tecnologias de varredura nao 
invasiva, inclusive novas formas de IRM, magnetencelografia 
(medicao dos campos magnéticos produzidos pela atividade 
elétrica do cérebro) e tractografia de difusao (um método 
para tracar os caminhos dos feixes de fibras no cérebro). 
Como explico no capitulo 10, a resolucao espacial da 
varredura cerebral nao invasiva esta aumentando a um 
ritmo exponencial. A pesquisa de Van J. Wedeen e seus 
colegas no Massachusetts General Hospital, que descrevi no 
capitulo 4, mostrando uma estrutura de grade altamente 
regular da fiacao do neocdrtex, € um dos _ primeiros 
resultados desse projeto. 

O neurocientista computacional Anders Sandberg 
(nascido em 1972), da Universidade de Oxford, e o fildsofo 
sueco Nick Bostrom (nascido em 1973) escreveram o 
abrangente Whole brain emulation: a roadmap, que detalha 
os requisitos para a simulacao do cérebro humano (e de 
outros tipos de cérebros) em _ niveis diferentes de 
especificidade de modelos funcionais de alto nivel para a 
simulacgao de moléculas [8]. O relatério nao apresenta uma 
linha do tempo, mas descreve os requisitos para a simulacao 
de diferentes tipos de cérebros com niveis variados de 
precisao em termos de varredura cerebral, modelagem, 
armazenamento e computacao. O relatério projeta ganhos 
exponenciais em todas essas areas de capacidade e diz que 
as condicdoes para simular o cérebro humano com elevado 
nivel de detalhamento estao comecando a ser viaveis. 
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Um esboco das capacidades tecnolégicas necessarias para emulacao completa 
do cérebro, em Whole brain emulation: a roadmap, de Anders Sandberg e Nick 
Bostrom 
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Um esboco de Whole brain emulation: a roadmap, de Anders Sandberg e Nick 
Bostrom 


Redes neurais 


Em 1964, entao com 16, escrevi para Frank Rosenblatt 
(1928-1971), professor da Universidade Cornell, 
perguntando-lhe sobre uma maquina chamada Mark 1 
Perceptron. Ele a havia criado quatro anos antes, e diziam 


que tinha propriedades semelhantes as de um cérebro. Ele 
me convidou a visita-lo e experimentar a maquina. 


Primeira camada Gamada intermediaria Gamadas 
da rede neural da rede neural de output 
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Todas as conexdes sao atribuidas aleatoriamente - 


O Perceptron foi construido a partir do que ele chamou de 
modelos eletrénicos de neurdénios. Os inputs consistiam em 
valores organizados em duas dimensoes. Para a fala, uma 
dimensao representava a frequéncia e outra o tempo, de 
modo que cada valor representava a intensidade de uma 
frequéncia num dado momento do tempo. Para as imagens, 
cada ponto era um pixel numa imagem bidimensional. Cada 
ponto de um _- determinado input era  conectado 
aleatoriamente aos inputs da primeira camada de neurénios 
simulados. Cada conexao tinha uma _ forca sinaptica 
associada representando sua importancia, estabelecida 
inicialmente com um valor aleatério. Cada neurdénio somava 
os sinais que chegavam até ele. Se o sinal combinado 
excedesse um limiar especifico, o neurdnio disparava e 


enviava um sinal para seu output, se o sinal combinado de 
input nao excedesse o limiar, o neurénio nao diSparava e seu 
output era zero. O output de cada neurdnio estava 
conectado aleatoriamente aos inputs dos neurénios na 
camada seguinte. O Mark 1 Perceptron tinha trés camadas, 
que podiam ser organizadas em diversas configurac6es. Por 
exemplo, uma camada poderia retroalimentar uma anterior. 
Na camada mais elevada, 0 output de um ou mais neurénios, 
também selecionados aleatoriamente, proporcionava a 
resposta. (Para uma descricao algoritmica das redes neurais, 
ver esta nota [9].) 

Como a fiacao da rede neural e os pesos sinapticos sao 
estabelecidos aleatoriamente no inicio, as respostas de uma 
rede neural nao treinada também sao aleatdrias. A chave 
para uma rede neural, portanto, 6 que ela precisa aprender o 
seu objeto, assim como os cérebros de mamiferos nos quais 
ela seria supostamente modelada. Uma rede neural comeca 
ignorante; seu professor - que pode ser um humano, um 
programa de computador ou talvez outra rede neural mais 
madura, que ja aprendeu suas li¢des - recompensa a rede 
neural aprendiz quando ela gera o output correto e pune-a 
quando ela nao o faz. Esse feedback, por sua vez, 6 uSsado 
pela rede neural aprendiz para ajustar a forca de cada 
conexao interneural. Conexoes consistentes com a resposta 
correta sao fortalecidas. Aquelas que apresentam uma 
resposta errada sao enfraquecidas. 

Com o tempo, a rede neural se organiza para apresentar 
as respostas corretas sem _  supervisao. Experimentos 
mostraram que as redes neurais podem aprender seu objeto 
de interesse mesmo com professores pouco confiaveis. Se o 
professor esta correto apenas 60% do tempo, a rede neural 


aprendiz ainda vai aprender suas li¢Oes com uma precisao 
proxima de 100%. 

Contudo, as limitagodes na gama de material que o 
Perceptron era capaz de aprender tornaram-se aparentes em 
pouco tempo. Quando visitei o professor Rosenblatt em 
1964, tentei fazer modificagdoes simples no input. O sistema 
foi preparado para identificar letras impressas, e reconhecia- 
aS com razoavel precisao. Fazia um bom trabalho de 
autoassociacgao (ou seja, identificava as letras mesmo que 
eu cobrisse parte delas), mas nao se saia tao bem com a 
invariancia (ou seja, generalizando mudancas de tamanho e 
de tipo de fonte, 0 que o confundia). 

Na ultima metade da década de 1960, essas redes 
neurais tornaram-se imensamente populares, e o campo do 
“conexionismo” ocupou pelo menos metade do campo da 
intelig@ncia artificial. A abordagem mais tradicional a IA, 
enquanto isso, incluiu tentativas diretas de programar 
solucoes para problemas especificos, como O 
reconhecimento das propriedades invariantes de letras 
impressas. 

Outra pessoa que visitei em 1964 foi Marvin Minsky 
(nascido em 1927), um dos fundadores do campo da 
intelig@ncia artificial. Apesar de ter feito alguns trabalhos 
pioneiros sobre redes neurais na década de 1950, ele estava 
preocupado com o grande surto de interesse nessa técnica. 
Parte do encanto das redes neurais era a suposicao de que 
nao exigiam programacao - aprenderiam sozinhas as 
solugdes para os problemas. Em 1965, entrei para o MIT 
como estudante, tendo o professor Minsky como meu 
orientador, e compartilhei seu ceticismo sobre a moda do 
“conexionismo”. 


Em 1969, Minsky e Seymour Papert (nascido em 1928), 
os dois cofundadores do MIT Artificial Intelligence 
Laboratory, escreveram um livro chamado Perceptrons, que 
apresentava um Unico teorema central: que um perceptron 
era intrinsecamente incapaz de determinar se uma imagem 
seria conexa. O livro causou um incéndio. Determinar uma 
conexao ou a falta dela numa imagem é uma tarefa que os 
humanos podem fazer com bastante facilidade, e também é 
um processo objetivo para programar um computador para 
fazer esta discriminacao. O fato de os perceptrons nao 
conseguirem realiza-la era considerado por muitos uma 
falha fatal. 

Muitos, porém, interpretaram o livro Perceptrons como se 
ele implicasse mais do que de fato fazia. O teorema de 
Minsky e Papert se aplicava apenas a um tipo particular de 
rede neural chamado rede neural de alimentacao avante 
(uma categoria que inclui o perceptron de Rosenblatt); 
outros tipos de redes neurais nao tinham essa limitacao. 
Mesmo assim, o livro conseguiu liquidar com a maior parte 
das verbas para pesquisas sobre redes neurais na década de 
1970. O campo retornou na década de 1980 com algumas 
tentativas de utilizar modelos considerados mais realistas de 
neurdnios bioldgicos, evitando as limitagdes implicadas pelo 
teorema do perceptron de Minsky-Papert. Nao obstante, a 
Ccapacidade do neocdértex para solucionar o problema da 
invariancia, um elemento fundamental de sua forca, era uma 
habilidade que continuava além do alcance do ressurgente 
Campo conexionista. 


Duas imagens da capa do livro Perceptrons, de Marvin Minsky e Seymour 
Papert. A imagem superior nado esta conectada (ou seja, a area escura consiste 
em duas partes desconexas). A imagem inferior 6 conexa. Um humano pode 
determinar isso prontamente, tal como um simples programa de software. Um 
perceptron de alimentacgao avante como o Mark 1 Perceptron de Frank 
Rosenblatt nao consegue fazer essa determinacao 


Codificacao esparsa: quantizacao vetorial 


No comeco da década de 1980, dei inicio a um projeto 
dedicado a outro problema classico do reconhecimento de 
padroes: compreender a fala humana. No inicio, uSamos 
métodos tradicionais da IA, programando diretamente o 
conhecimento de_ especialistas sobre as _ unidades 
fundamentais da fala - fonemas - e regras de linguistas 
sobre a forma como pessoas unem fonemas para construir 


palavras e frases. Cada fonema tem padroes de frequéncia 
distintos. Por exemplo, sabemos que vogais como “e” e “a” 
Sao caracterizadas por certas frequ@ncias ressonantes 
chamadas formantes, com uma proporcao caracteristica de 
formantes para cada fonema. Sons sibilantes como “z” e “s” 
sao caracterizados por uma explosao de ruido que abrange 
muitas frequéncias. 

Capturamos a fala como uma forma de onda, que entao 
convertemos em  multiplas bandas de_ frequéncias 
(percebidas como tons) usando um banco de filtros de 
frequéncia. O resultado dessa transformacao pode ser 
visualizado e se chama espectrograma (ver pagina 170). 

O banco de filtros esta copiando aquilo que a cdéclea 
humana faz, que € o passo inicial de nosso processamento 
bioldgico do som. Primeiro, o software identificou fonemas 
com base em padroées distintos de frequéncias e depois 
identificou palavras com base na_ identificag¢ao de 
sequéncias de fonemas caracteristicos. 

O resultado foi parcialmente bem-sucedido. Pudemos 
ensinar nosso aparelho a aprender os padroes de uma 
pessoa em particular usando um vocabulario de tamanho 
moderado, medido em milhares de palavras. Quando 
tentamos identificar dezenas de milhares de palavras, lidar 
com diversos falantes e permitir uma fala totalmente 
continua (ou seja, a fala sem pausas entre palavras), 
deparamos com o problema da_invariancia. Pessoas 
diferentes pronunciaram o mesmo fonema de maneira 
diferente - por exemplo, o fonema “e” de uma pessoa pode 
se parecer com o “ah” de outra. Até a mesma pessoa 
demonstrou inconsisténcia na maneira como pronunciou 
determinado fonema. Volta e meia, 0 padrao de um fonema 
foi afetado pelos fonemas préximos. Muitos fonemas foram 


deixados completamente de lado. A pronuncia das palavras 
(ou seja, O modo como os fonemas se unem para formar 
palavras) também variou muito e dependeu do contexto. As 
regras linguisticas que tinhamos programado estavam sendo 
transgredidas e nao conseguiamos acompanhar a extrema 
variabilidade da linguagem falada. 
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Um espectrograma de trés vogais. Da esquerda para a direita: [i], como em 
“apreciar”, [U] como em “acustico” e [a] como em “ah”. O eixo Y representa a 
frequéncia do som. Quanto mais escura a banda, mais energia acustica naquela 
frequéncia 
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Espectrograma de uma pessoa dizendo a palavra inglesa “hide” (esconder). As 
linhas horizontais mostram os formantes, que sao frequéncia sustentadas com 
energia particularmente elevada [10] 


Para mim ficou claro na @poca que a esséncia do padrao 
humano e da_ identifica¢ao conceitual baseava-se em 
hierarquias. Isso certamente é€ aparente na linguagem 
humana, que constitui uma _ hierarquia complexa de 
estruturas. Mas qual é€ o elemento na base das estruturas? 
Essa foi a primeira pergunta que analisei ao procurar formas 
de identificar automaticamente uma _ fala humana 
absolutamente normal. 

O som entra pelo ouvido como uma vibracao do are é 
convertido em multiplas bandas de_ frequéncia_ por 
aproximadamente 3 mil células capilares internas da céclea. 
Cada célula capilar esta sintonizada numa_ frequéncia 
especifica (observe que percebemos as frequéncias como 
tons) e cada uma atua como um filtro de frequéncias, 
emitindo um sinal sempre que existe um som em sua 
frequéncia de ressonancia ou perto dela. Portanto, ao sair da 
céclea humana, 0 som é representado por cerca de 3 mil 
Sinais distintos, cada um significando a intensidade - 
variada ao longo do tempo - de uma banda estreita de 
frequéncias (com substancial Superposicao entre essas 
bandas). 

Apesar de ter ficado aparente que o cérebro era 
substancialmente paralelo, parecia-me impossivel para o 
cérebro fazer 0 pareamento de padroes de 3 mil sinais 
auditivos distintos. Suspeitei que a evolucao pudesse ser 
ineficiente. Agora sabemos que acontece uma reducao 
bastante substancial de dados no nervo auditivo antes que 
OS sinais sonoros atinjam o neocortex. 

Em nossos identificadores de fala baseados em software, 
também usamos filtros implementados como software - 16, 
para ser exato (que depois aumentamos para 32, pois 
descobrimos que nao havia muito beneficio se féssemos 


muito além disso). Assim, em nosso sistema, cada ponto no 
tempo era representado por 16 numeros. Precisavamos 
reduzir esses 16 feixes de dados a um, enfatizando, ao 
mesmo tempo, as caracteristicas que sao significativas para 
o reconhecimento de fala. 

Usamos uma técnica matematicamente otimizada para 
fazer isso, chamada quantizacao vetorial. Pense que em 
qualquer momento especifico, 0 som (pelo menos num 
ouvido) era representado por nosso software com 16 
numeros diferentes: ou seja, o output de 16 filtros de 
frequéncia. (No sistema auditivo humano, o numero seria 3 
mil, representando o output de 3 mil células capilares 
internas da cdclea.) Na terminologia matematica, cada um 
desses conjuntos de numeros (sejam os 3 mil no caso 
bioldgico ou os 16 em nossa implementacao por software) é 
chamado de vetor. 

Para simplificar, vamos considerar o processo de 
quantizacao vetorial com vetores de dois numeros. Cada 
vetor pode ser considerado um _ ponto no- espaco 
bidimensional. 


Um vetor composto 
= cay 
de dois nimeros 


Se tivermos uma amostra bem grande desses vetores e 
os plotarmos, € provavel que percebamos a formacao de 
grupos. 
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Para identificarmos oS grupos, precisamos_ decidir 
quantos vamos permitir. Em nosso projeto, de maneira geral, 
permitimos 1.024 grupos para podermos numera-los e 
atribuir a cada grupo um rotulo de 10 bits (pois 210 = 
1.024). Nossa amostra de vetores representa a diversidade 
que esperamos. Designamos arbitrariamente os primeiros 
1.024 vetores como grupos de um ponto. Depois, analisamos 
0 1.0250 vetor e descobrimos 0 ponto mais préximo a ele. Se 
essa distancia for maior do que a menor distancia entre 
qualquer par dos 1.024 pontos, consideramo-lo o inicio de 
um novo grupo. Depois, reduzimos os dois grupos (de um 
ponto) mais préximos a um Unico grupo. Assim, ainda nos 
restam 1.024 grupos. Apdés processar o 1.0250 vetor, um 
desses grupos tera agora mais do que um _ ponto. 
Continuamos a processar os pontos dessa maneira, sempre 
mantendo 1.024 grupos. Apdés processarmos todos os 


pontos, representamos cada grupo multipontos pelo centro 
geomeétrico dos pontos desse grupo. 


e °@ @ Um grupo de pontos. 
° : eooe Representamo-lo usando um 
eos. Unico ponto que e o centro 
eee eee geometrico de todos os 
e* eee pontos desse grupo. 


Continuamos com esse processo iterativo até termos 
passado por todos os pontos da amostra. Normalmente, 
processamos milhédes de pontos em 1.024 grupos (2?!°); 
também usamos 2.048 (21!) ou 4.096 (212) grupos. Cada 
grupo € representado por um vetor que fica no centro 
geométrico dos pontos desse grupo. Logo, o total das 
distancias entre todos os pontos do grupo até o ponto 
central do grupo € o menor possivel. 

O resultado dessa técnica 6 que, em vez de ter os 
milhées de pontos com que comecamos (e um numero ainda 
maior de pontos possiveis), agora reduzimos os dados a 
apenas 1.024 pontos que usam o espaco de possibilidades 
de forma ideal. Nao sao atribuidos grupos a partes do espaco 
que nunca Sao uSsadas. 

Entao, atribuimos um numero para cada grupo (em nosso 
caso, de O a 1.023). Esse numero @é a representacao 
reduzida, “quantizada” desse grupo, motivo pelo qual a 
técnica € chamada de quantizacao vetorial. Qualquer vetor 
de input que surgir no futuro sera representado pelo numero 
do grupo cujo ponto central estiver mais préximo desse novo 
vetor de /nput. 

Agora, podemos pré-calcular uma tabela com a distancia 
entre o ponto central de cada grupo e todos os outros pontos 


centrais. Portanto, teremos disponivel, de forma instantanea, 
a distancia entre esse novo vetor de input (que 
representamos por esse ponto quantizado -  noutras 
palavras, pelo numero do grupo que estiver mais préximo 
desse novo ponto) e todos os outros grupos. Como estamos 
representando apenas os pontos por seu grupo mais 
proximo, agora conhecemos a distancia entre este ponto e 
qualquer outro ponto que possa surgir. 

Descrevi a técnica acima usando vetores com apenas dois 
numeros, mas o trabalho com vetores de 16 elementos é 
totalmente analogo ao exemplo mais simples. Como 
escolhemos vetores com 16 numeros representando 16 
bandas de frequ@ncia diferentes, cada ponto de nosso 
sistema era um ponto do espaco tetradecadimensional. E 
dificil imaginar um espagco com mais de trés dimensdes 
(talvez quatro, caso incluamos o tempo), mas a matematica 
nao tem essas inibicoes. 

Realizamos quatro coisas com esse processo. Primeiro, 
reduzimos bastante a complexidade dos dados. Segundo, 
reduzimos dados_~ tetradecadimensionais a dados 
unidimensionais (ou seja, agora cada amostra € um Unico 
numero). Terceiro, melhoramos nossa capacidade de 
encontrar caracteristicas invariantes, pois estamos 
enfatizando porcoes do espaco de sons possiveis que 
transmitem mais informacoes. Muitas das combinagoes de 
frequéncias sao fisicamente impossiveis ou, no minimo, 
muito improvaveis, por isso nao ha motivo para dar o mesmo 
espagco as combinacdes improvaveis de j/nput que 
reservamos para as provaveis. Essa técnica reduz os dados a 
possibilidades igualmente provaveis. O quarto beneficio é 
que podemos usar __identificadores de padroes 
unidimensionais, mesmo que os dados originais consistam 


em muitas outras dimensdes. Pelo que vimos, essa é a 
abordagem mais eficiente para utilizarmos os recursos 
computacionais disponiveis. 


Lendo sua mente com os Modelos Ocultos 
de Markov 


Com a quantizacao vetorial, simplificamos os dados de modo 
a enfatizar as caracteristicas principais, mas ainda 
precisamos de um modo de representar a hierarquia de 
caracteristicas invariantes que daria sentido as novas 
informacoes. Tendo trabalhado no campo de reconhecimento 
de padroes naquela época (inicio da década de 1980) por 20 
anos, eu Sabia que as representac6es unidimensionais eram 
bem mais poderosas, eficientes e receptivas a resultados 
invariantes. Nao se conhecia muito bem o neocortex no 
inicio da década de 1980, mas, com base em minha 
experiéncia com diversos problemas de reconhecimento de 
padroes, presumi que o cérebro também deveria reduzir 
seus dados multidimensionais (fossem dos olhos, dos 
ouvidos ou da_ pele), usando uma_ representacao 
unidimensional, especialmente com a ascensao dos 
conceitos na hierarquia do neocortex. 

No problema do reconhecimento da fala, a organizacao 
da informacao no sinal da fala parecia ser uma hierarquia de 
padroes, na qual cada padrao era representado por uma 
série linear de elementos projetados adiante. Cada elemento 
de um padrao poderia ser outro padrao num nivel inferior, 
ou uma unidade de /nput fundamental (que, no caso do 
reconhecimento de fala, seriam nossos vetores quantizados). 


Vocé vai perceber que essa situacao é consistente com o 
modelo de neocdrtex que apresentei antes. Logo, a fala 
humana é produzida por uma hierarquia de padroes lineares 
no cérebro. Se pudéssemos examinar simplesmente esses 
padroes no cérebro da pessoa que fala, seria apenas questao 
de parear suaS novas manifestac6es verbais com seus 
padroes cerebrais e compreender o que a pessoa estaria 
dizendo. Infelizmente, nao temos acesso direto ao cérebro 
do falante - a Unica informacao de que dispomos é€ o que ele 
efetivamente disse. E claro que essa é a meta da linguagem 
falada: o falante esta compartilhando uma parcela de sua 
mente em sua manifestacao oral. 
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Exemplo simples de uma camada de um Modelo Oculto de Markov. S1 a Sq 
representam os estados internos “ocultos”. Cada uma das transicoes Pj 
representa a probabilidade de passar do estado S; para o estado Sj. Essas 


probabilidades sao determinadas pelo aprendizado do sistema a partir dos 
dados de treinamento (inclusive durante o uso efetivo). Uma nova sequéncia 
(como uma nova manifestacao oral) 6 pareada com essas probabilidades para 
se determinar a possibilidade de que esse modelo produza a sequéncia 


Assim, eu pensei: existe uma técnica matematica que nos 
permitiria inferir os padrées no cérebro do falante com base 
em suas palavras faladas? Obviamente, uma manifestacao 
oral nao seria suficiente, mas se tivéssemos um grande 
numero de amostras, poderiamos usar essa informacao para 
ler oS padroes no neocortex do falante (ou, no minimo, 


formular alguma coisa matematicamente equivalente que 
nos possibilitaria identificar novas manifestacoes orais)? 

As pessoas nao costumam perceber o poder da 
matematica - lembre-se de que nossa capacidade de 
pesquisar boa parte do conhecimento humano numa fracgao 
de segundo com motores de pesquisa baseia-se numa 
técnica matematica. Para lidar com o problema do 
reconhecimento de fala que enfrentei no inicio da década de 
1980, percebi que a técnica dos Modelos Ocultos de Markov 
atendia perfeitamente a necessidade. O matematico russo 
Andrei Andreyevich Markov (1856-1922) construiu uma 
teoria matematica de sequéncias hierarquicas de estados. O 
modelo baseava-se na possibilidade de transpor os estados 
numa cadeia, e, se isso fosse bem-sucedido, de disparar um 
estado no nivel hierarquico imediatamente superior. Parece 
familiar? 

O modelo de Markov incluiu as probabilidades da 
ocorréncia bem-sucedida de cada estado. Ele prosseguiu e 
hipotetizou uma situag¢ao em que um sistema tem essa 
hierarquia de sequéncias lineares de estados, mas nao é 
possivel examina-los diretamente - dai 0 nome, Modelos 
Ocultos de Markov. O nivel mais baixo da hierarquia emite 
Sinais que podem ser vistos por todos. Markov apresenta 
uma técnica matematica para computar que probabilidades 
de cada transi¢ao devem ser baseadas no output observado. 
O método foi aprimorado posteriormente por Norbert Wiener 
em 1923. O aprimoramento de Wiener também apresentou 
um modo para se determinar as conexoes no modelo de 
Markov; basicamente, qualquer conexao com uma 
probabilidade tao baixa era considerada inexistente. Em 
sintese, € assim que o neocértex humano elimina conexdées: 
se elas raramente (OU nunca) Sao usadas, sao consideradas 


improvaveis e@ sao podadas. Em nosso caso, o output 
observado é o sinal de fala criado pela pessoa que fala, e as 
probabilidades e conex6des de estado do modelo de Markov 
constituem a hierarquia neocortical que a produziu. 

Idealizei um sistema no qual tomariamos amostras de 
fala humana, aplicarfamos a técnica dos Modelos Ocultos de 
Markov para inferir uma hierarquia de estados com conexdes 
e probabilidades (basicamente um neocortex simulado para 
a producao de fala), e@ usariamos depois essa rede 
hierarquica inferida de estados para identificar novas 
manifestacoes orais. Para criar um sistema independente do 
falante, uSariamos amostras de muitos individuos diferentes 
para treinar os modelos ocultos de Markov. Acrescentando o 
elemento das hierarquias para representar a natureza 
hierarquica da informacao na linguagem, eles foram 
chamados apropriadamente de Modelos’ Hierarquicos 
Ocultos de Markov (ou HHMMs, de Hierarchical Hidden 
Markov Models). 

Meus colegas na_ Kurzweil Applied Intelligence 
mostraram-se céticos diante da viabilidade dessa técnica, 
tendo em vista que se tratava de um meétodo auto- 
organizado que lembrava as redes neurais, que haviam 
caido em descrédito e com as quais haviamos tido pouco 
sucesso. Mostrei que a rede num sistema neural é fixa e nao 
se adapta ao /nput: os pesos se adaptam, mas as conexoes, 
nao. No modelo de Markov, desde que _ preparado 
corretamente, o sistema podaria as conex6oes nao utilizadas, 
adaptando-se a topologia. 

Estabeleci um projeto que foi considerado um “skunk 
works” (expressao organizacional para um projeto que nao 
segue caminhos convencionais e que tem pouco apoio de 
recursos formais), formado por mim, um programador que 


trabalhava em meio expediente e um engenheiro elétrico 
(para criar o banco de filtros de frequéncia). Para a surpresa 
de meus colegas, nosso esfor¢o mostrou-se bem-sucedido, 
tendo éxito na identificacao bastante precisa de fala de um 
vocabulario extenso. 

Depois desse experimento, todos os nossos esforcos 
posteriores de reconhecimento de fala basearam-se em 
modelos hierarquicos ocultos de Markov. Aparentemente, 
outras empresas de reconhecimento de fala descobriram o 
valor desse método de maneira independente, e, desde 
meados da década de 1980, muitos trabalhos de 
reconhecimento automatizado de fala tam se baseado nessa 
abordagem. Os Modelos Ocultos de Markov também sao 
usados na sintese da fala - lembre-se de que nossa 
hierarquia cortical bioldgica 6 usada nao so para identificar 
inputs como para produzir outputs, como aé fala e 
movimentos fisicos. 
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Estados ocultos de Markov e possiveis transicdes para produzir uma sequéncia 
de palavras em um texto de linguagem natural 


Os HHMMs também sao usados em sistemas que 
compreendem o significado de frases em linguagem natural, 
oO que representa uma ascensao na hierarquia conceitual. 


Para compreender o funcionamento do método HHMM, 
comecamos com uma rede que consiste em todas as 
transicodes de estado possiveis. O método de quantizacao 
vetorial descrito antes é critico aqui, pois do contrario 
haveria possibilidades demais para se analisar. 

Eis uma possivel topologia inicial simplificada: 


“one” — W-AX-N 
HMM para HMM para HMM para 
“WW” “Ay “ny” 


O — O 


nodo de input nodo de output 


HMM para HMM para 


od he "OU" 


Topologia simples de Modelo Oculto de Markov para identificar duas palavras 
faladas 


Amostras de manifestacoes orais sao processadas uma a 
uma. Para cada uma, modificamos iterativamente as 
probabilidades das transicoes para refletir melhor a amostra 
de input que acabamos de processar. Os modelos de Markov 
usados no reconhecimento de fala codificam a possibilidade 
de encontrar padrdes sonoros especificos em cada fonema, 
como os fonemas se influenciam mutuamente e as ordens 
provaveis dos fonemas. O sistema também pode incluir 
redes de probabilidade em niveis superiores da estrutura da 
linguagem, como a ordem das palavras, a inclusao de frases 
e assim por diante, subindo pela hierarquia da linguagem. 


Embora nossos sistemas anteriores de reconhecimento de 
fala incorporassem regras especificas sobre estruturas e 
sequéncias de fonemas explicitamente codificadas por 
linguistas humanos, 0 novo sistema com base HHMM nao 
Sabia explicitamente que existem 44 fonemas em inglés, 
nem as sequéncias de vetores mais provaveis para cada 
fonema, ou quaiS sequéncias de fonemas eram mais 
provaveis do que outras. Deixamos o sistema descobrir essas 
“regras” sozinho a partir de milhares de horas de dados 
transcritos de fala humana. A vantagem dessa abordagem 
sobre regras codificadas a mao é que os modelos 
desenvolvem  regras’ probabilisticas das quaiS os 
especialistas humanos nem sempre estao a par. Percebemos 
que muitas regras que o sistema aprendeu automaticamente 
com os dados divergiam de maneiras sutis, mas importantes, 
das regras estabelecidas por especialistas humanos. 

Depois que a rede foi treinada, comecgamos a tentar 
identificar a fala levando em conta os caminhos alternativos 
através da rede e escolhendo o caminho mais provavel, 
tendo em mente a sequéncia real de vetores de input que 
tinhamos visto. Noutras palavras, se vimos uma sequéncia 
de estados que tinha a probabilidade de produzir aquela 
manifestacao oral, concluimos que ela proveio da sequéncia 
cortical. Esse neocortex simulado e baseado em HHMM 
incluiu. rdtulos de _ palavras, permitindo propor uma 
transcrigao daquilo que ele ouvira. 

Depois, pudemos aprimorar ainda mais nossos resultados 
continuando a treinar a rede ao mesmo tempo em que a 
usamos para identificagao. Como discutimos, a identificacao 
€ Oo aprendizado simultaneos também acontecem em todos 
Os niveis de nossa hierarquia neocortical biolégica. 


Algoritmos evolutivos (genéticos) 


Ha ainda  outra  consideracao importante: como 
estabelecemos os diversos parametros que controlam o 
funcionamento de um sistema de reconhecimento de 
padroes? Poderiamos incluir 0 numero de vetores que 
habilitamos na etapa de quantizacao vetorial, a topologia 
inicial de estados hierarquicos (antes de a fase de 
treinamento do processo do Modelo Oculto de Markov poda- 
los), o limiar de identificacao em cada nivel da hierarquia, os 
parametros que controlam o tratamento dos parametros de 
tamanho, e muitos outros. Podemos estabelecé-los com base 
em nossa intuigcao, mas os resultados estarao muito 
distantes do ideal. 

Chamamos esses parametros de “parametros de Deus” 
porque eles sao estabelecidos antes do método auto- 
organizado de determinacgao da topologia dos Modelos 
Ocultos de Markov (ou, no caso biolédgico, antes que a 
pessoa aprenda suas licdes criando, de modo similar, 
conexdes em sua hierarquia cortical). Talvez seja um nome 
inadequado, uma vez que esses detalhes de desenho inicial 
com base no DNA sao determinados pela evolucao bioldgica, 
embora alguns possam ver a mao de Deus nesse processo 
(embora eu considere que a evolucao seja um processo 
espiritual, essa discussao pertence ao capitulo 9). 

Quando chegou o momento de estabelecer esses 
“parametros de Deus” em nosso sistema _ hierarquico 
simulado de aprendizado e_ identificagao, pegamos 
emprestada novamente uma pista da natureza e decidimos 
desenvolvé-la - em nosso caso, usando uma simulacao da 
evolugcao. Usamos os chamados algoritmos genéticos ou 


evolutivos (AGs), que incluem reprodugao sexual e 
mutacoes simuladas. 

Eis uma descricao simplificada do funcionamento desse 
método. Primeiro, determinamos um modo de codificar 
possiveis solucdes para determinado problema. Se o 
problema for a otimizacao dos parametros de projeto de um 
circuito, entao definimos uma lista com todos os parametros 
(com um numero especifico de bits designados para cada 
parametro) que caracterizam o circuito. Essa lista 64 
considerada o cddigo genético do algoritmo genético. 
Depois, geramos aleatoriamente milhares de _ cddigos 
genéeticos, ou mais. Cada um desses cédigos genéticos (que 
representa um conjunto de parametros designados) é 
considerado um organismo simulado de “solucao”. 

Depois, avaliamos cada organismo simulado num 
ambiente simulado, usando um método definido para avaliar 
cada conjunto de parametros. Essa avaliagcao 6 uma chave 
para o sucesso de um algoritmo genético. Em nosso 
exemplo, cada programa gerado pelos parametros seria 
executado e julgado segundo critérios apropriados (ele 
completou a tarefa, quanto tempo levou, e assim por 
diante). OS organismos com a melhor solucao (os melhores 
projetos) podem sobreviver, e os restantes sao eliminados. 

Agora, fazemos com que cada um dos sobreviventes se 
multiplique até terem atingido o mesmo numero de 
criaturas-solucao. Isso é feito simulando a _ reproducao 
sexual: noutras palavras, criamos uma nova prole, e cada 
criatura nova extrai uma parte de seu cddigo genético de 
um progenitor e outra parte de um segundo progenitor. 
Normalmente, nao se faz distingao entre organismos 
masculinos ou femininos; basta gerar uma prole a partir de 
dois progenitores arbitrarios, e por isso estamos falando 


basicamente de casamentos do mesmo sexo. Talvez nao seja 
tao interessante quanto a reproducao sexual no mundo 
natural, mas o ponto relevante aqui é ter dois progenitores. 
Como esses organismos simulados se _ reproduzem, 
permitimos que ocorra alguma mutacgao (mudancas 
aleatérias) nos cromossomos. 

Bem, definimos uma geracao de evolucao simulada; 
depois, repetimos essas etapasS para cada geracao 
subsequente. Ao cabo de cada geracao, determinamos qual 
a melhora nos desenhos (ou seja, computamos a melhoria 
média na funcgao de avaliagcao em todos os organismos 
sobreviventes). Quando o grau de melhoria de uma geracao 
para outra na avaliacao do desenho das criaturas torna-se 
muito pequeno, paramos esse ciclo iterativo e usamos os 
melhores desenhos na ultima geracao. (Para uma descricao 
algoritmica dos algoritmos genéticos, ver esta nota [11].) 

A chave para um algoritmo genético 6 que os projetistas 
humanos nao programam diretamente uma solucao; em vez 
disso, deixamos que ela emerja através de um processo 
iterativo de competicao e melhoria simuladas. A evolucgao 
bioldgica € sagaz mas lenta, e por isso, para reforcar sua 
intelig@ncia, aceleramos bastante esse ritmo pesado. O 
computador é rapido o bastante para simular muitas 
geracoes numa questao de horas ou dias, e algumas vezes o 
deixamos trabalhar durante semanas para simular centenas 
de milhares de geracgoes. Mas temos de passar apenas uma 
vez por esse processo iterativo; assim que deixamos essa 
evolugao simulada trilhar seu curso, podemos aplicar 
rapidamente as regras evoluidas e altamente refinadas a 
problemas reais. No caso de _ nossos_ sistemas de 
reconhecimento de fala, nds os uSamos para desenvolver a 
topologia inicial da rede e outros parametros criticos. Logo, 


usamos dois métodos auto-organizados: um AG para simular 
a evolucao biolégica que deu origem a um desenho cortical 
especifico, e HHMMs para simular a organizacao cortical que 
acompanha o aprendizado humano. 

Outro requisito importante para o sucesso de um AG é 
um método valido de avaliacao de cada solucao possivel. 
Essa avaliacao precisa ser feita rapidamente, pois deve levar 
em conta milhares de solucdes possiveis para cada geracao 
de evolucao simulada. Os AGS sao habeis no tratamento de 
problemas com muitas variaveis para o calculo de solucdes 
analiticas precisas. O projeto de um motor, por exemplo, 
pode compreender mais de cem variaveiS e exige a 
satisfag¢ao de dezenas de limitagcdoes; AGs usados pelos 
pesquisadores da General Electric conseguiram desenhar 
motores a jato que aderem as limitacdes de forma bem mais 
precisa do que os métodos convencionais. 

Mas € preciso ser cauteloso nas expectativas quando 
usamos AGs. Um algoritmo genético foi usado para resolver 
um problema de empilhamento de blocos, e obteve uma 
solucao perfeita... sO que ela implicava milhares de etapas. 
Os programadores humanos se esqueceram de incluir a 
minimizagao do numero de etapas em sua funcao de 
avaliacao. 

O projeto Electric Sheep, de Scott Drave, € um AG que 
produz arte. A funcao de avaliacgao usa avaliadores humanos 
numa colaboracgao de fonte aberta que envolve muitos 
milhares de pessoas. A arte se move através do tempo e 
vocé pode aprecia-la em electricsheep.org. 

Para o reconhecimento de fala, a combinacgao de 
algoritmos genéticos e de modelos ocultos de Markov 
funcionou extremamente bem. A simulacgao da evolugao com 
um AG foi capaz de melhorar substancialmente o 


desempenho de redes HHMM. O que a evolucao produziu foi 
bem superior a nosso desenho original, que se baseava em 
nossa intuicao. 

Depois, experimentamos introduzir uma _ série de 
pequenas variagdes no. sistema _ geral. Por exemplo, 
introduzimos perturbacdes (pequenas mudancas aleatorias) 
no input. Outra dessas mudancas consistiu em fazer com 
que modelos de Markov adjacentes “vazassem” um no outro, 
levando os resultados de um modelo de Markov a influenciar 
modelos que estivessem “prdéximos”. Apesar de nao termos 
percebido isso na época, o tipo de ajuste que 
experimentamos é muito similar ao tipo de modificagcao que 
ocorre em estruturas corticais biolégicas. 

No inicio, essas mudancas prejudicam o desempenho 
(medido pela precisao da_ identificacao). Mas, se 
tornassemos a executar a evolucao (ou seja, tornassemos a 
executar o AG) com essas alteragdes aplicadas, isso 
adaptaria coerentemente o sistema, otimizando-o para essas 
modificacoes introduzidas. De modo geral, isso restauraria o 
desempenho. Se depois removéssemos aS mudancas 
introduzidas, 0 desempenho pioraria novamente, pois o 
sistema teria evoluido para compensar as mudancas. O 
sistema adaptado tornou-se dependente das mudancas. 

Um tipo de alterag¢ao que realmente ajudou o 
desempenho (apdos executar novamente o AG) foi a 
introdugao de pequenas mudancas aleatérias no input. O 
motivo para isso € o conhecido problema do “sobreajuste” 
em sistemas auto-organizados. Existe o perigo de que tal 
sistema generalize de forma exagerada os exemplos 
especificos contidos na amostra de treinamento. Fazendo 
ajustes aleatdrios no input, os padroes mais invariantes dos 
dados vao sobreviver, € com isso o sistema aprende esses 


padroes mais profundos. Isso sé ajudou quando tornamos a 
executar o AG com a caracteristica aleatéria acionada. 

Isso introduz um dilema na compreensao de nossos 
circuitos corticais bioldgicos. Percebeu-se, por exemplo, que 
pode mesmo haver um pequeno vazamento de uma conexao 
cortical para outra, resultante do modo como as conex6des 
bioldgicas se formam: aparentemente, a eletroquimica dos 
axOnios e dendritos esta sujeita aos efeitos eletromagnéticos 
das conex6des préximas. Suponha que somos capazes de 
realizar um experimento no qual removemos esse efeito de 
um cérebro de verdade. Sera dificil realiza-lo, mas nao 
necessariamente impossivel. Suponha que realizamos tal 
experimento e que descobrimos que os circuitos corticais 
funcionaram com menos eficiéncia sem esse vazamento 
neural. Podemos concluir que esse fendmeno foi um projeto 
bastante sagaz da evolucao e fundamental para que o 
cdértex atingisse seu nivel de desempenho. Podemos lembrar 
ainda que tal resultado mostra que o modelo organizado do 
fluxo de padroes que sobe pela hierarquia conceitual e o 
fluxo de predicoes que desce por ela eram, de fato, muito 
mais complicados por causa dessa intricada influéncia 
exercida pelas conexdes, umas sobre as outras. 

Mas essa nao seria necessariamente uma _ conclusao 
precisa. Veja nossa experiéncia com um cortex simulado 
com base em HHMMs, no qual implementamos uma 
modificacao muito similar a interferéncia entre neurénios. Se 
depois executassemos a evolugao com esse fendmeno 
ativado, o desempenho seria restaurado (porque o processo 
evolutivo se adaptou a ele). Se tirassemos depois a 
interferéncia, O desempenho seria novamente 
comprometido. No caso biolédgico, a evolucao (ou seja, a 
evolucao biolégica) na verdade foi “executada” com esse 


fendmeno ativado. Os parametros detalhados do sistema, 
portanto, foram estabelecidos pela evolucao bioldgica e 
dependem desses fatores; logo, sua modificacao afetara 
negativamente o desempenho, a menos que executemos 
novamente a evolucao. E vidvel fazé-lo no mundo simulado, 
no qual a evolucao ocupa apenas dias ou semanas, mas no 
mundo bioldégico isso exigiria dezenas de milhares de anos. 

Assim, como podemos saber se uma caracteristica 
especifica de desenho do neocdrtex biolédgico € uma 
inovacao vital introduzida pela evolucao bioldégica - ou seja, 
algo crucial para o nosso nivel de inteligéncia - ou apenas 
um artefato do qual o desenho do sistema depende, mas 
sem o qual poderia ter evoluido? Podemos responder a essa 
pergunta executando a evolucao simulada com e sem essas 
variacgdes especificas nos detalhes do desenho (por exemplo, 
sem e com interferéncia entre conexdes). Podemos fazé-lo 
até na evolucao biolédgica se estivermos examinando a 
evolugao de uma colénia de micro-organismos na qual as 
geracdes sao medidas em horas, mas isso nao é pratico em 
organismos complexos como os humanos. Essa é outra das 
muitas desvantagens da biologia. 

Voltando a nosso reconhecimento de fala, descobrimos 
que se executassemos a evolucgao (ou seja, um AG) 
separadamente no projeto inicial (1) dos modelos 
hierarquicos ocultos de Markov que estavam modelando a 
estrutura interna de fonemas e (2) da modelagem feita pelos 
HHMMs das estruturas das palavras e frases, obteriamos 
resultados ainda melhores. Os dois niveis do sistema 
estavam usando HHMMs, mas o AG desenvolveria variacoes 
de projeto entre esses niveis diferentes. Essa abordagem 
ainda permitiu a modelagem de fenOmenos que ocorrem 
entre os dois niveis, como a elisao de fonemas que costuma 


acontecer quando juntamos certas palavras (por exemplo, 
“Como vocés estao?” pode se tornar “Como ces’tao?”) 

E provavel que um fenémeno similar ocorra em regides 
diferentes do cortex biolédgico, pois elas desenvolveram 
pequenas diferencas com base no tipo de padroes com que 
precisam lidar. Embora todas essas regides usem 
basicamente o mesmo algoritmo neocortical, a evolucao 
bioldgica teve tempo suficiente para ajustar o desenho de 
cada uma delas a fim de otimiza-las para seus padroes 
especificos. Entretanto, como disse antes, neurocientistas e 
neurologistas perceberam uma _ plasticidade consideravel 
nessas areas, apoiando a ideia de um algoritmo neocortical 
geral. Se os métodos fundamentais de cada regiao fossem 
radicalmente diferentes, entao essa intercambiabilidade 
entre regides corticais nao seria possivel. 

Os sistemas que criamos em nossa pesquisa usando essa 
combinacao de métodos auto-organizados foram muito bem- 
sucedidos. No reconhecimento de fala, possibilitaram que se 
tratasse pela primeira vez a fala plenamente continua e 
vocabularios relativamente irrestritos. Pudemos atingir um 
indice bastante preciso com uma ampla variedade de 
falantes, sotaques e dialetos. Enquanto este livro esta sendo 
escrito, 0 maior avanco @é representado por um produto 
chamado Dragon Naturally Speaking (Versao 11. 5) para PC, 
da Nuance (antiga Kurzweil Computer Products). Sugiro que 
aS pessoas Oo experimentem caso duvidem do desempenho 
do reconhecimento de fala contemporaneo - a precisao 
costuma ficar em torno de 99% ou mais, apds alguns 
minutos de treinamento com sua voz em fala continua e 
vocabularios relativamente irrestritos. Dragon Dictation é 
um aplicativo gratuito para iPhone mais simples, mas ainda 
impressionante, que nao exige treinamento de voz. Siri, o 


assistente pessoal dos iPhones atuais da Apple, usa a 
mesma tecnologia de reconhecimento de fala com extensdes 
para poder compreender a linguagem natural. 

O desempenho desses sistemas € um testemunho do 
poder da matematica. Com eles, estamos essencialmente 
computando aquilo que acontece no neocdrtex de um 
falante - mesmo que nao tenhamos acesso direto ao cérebro 
dessa pessoa - como etapa essencial no reconhecimento 
daquilo que a pessoa esta dizendo e, no caso de sistemas 
como Siri, do significado dessas manifestacoes orais. 
Podemos nos perguntar se, ao olharmos de fato o neocértex 
do falante, veriamos conexées e pesos correspondentes aos 
modelos hierarquicos ocultos de Markov calculados pelo 
software. Com quase toda a certeza, nao descobririamos um 
pareamento preciso; as estruturas neuronais difeririam 
invariavelmente em muitos detalhes em comparacao com os 
modelos do computador. Entretanto, eu afirmaria que deve 
existir uma equivaléncia matematica essencial, com elevado 
grau de precisao, entre a biologia real e nossa tentativa de 
imita-la; do contrario, esses sistemas nao funcionariam tao 
bem como funcionam. 


LISP 


A LISP (sigla de LISt Processor) € uma linguagem de 
computacao especificada originalmente pelo pioneiro da IA 
John McCarthy (1927-2011) em 1958. Como seu nome 
sugere, a LISP lida com listas. Cada declaracao LISP 6 uma 
lista de elementos; cada elemento 6 uma lista ou um 
“atomo”, ou seja, um item irredutivel que consiste num 
numero ou num simbolo. Uma lista incluida numa lista pode 
ser a propria lista, e por isso a LISP 6 capaz de recursividade. 


Outro modo pelo qual as declaracdes LISP podem ser 
recursivas @ uma lista incluir uma lista, e assim por diante, 
até a lista original ser especificada. Como listas podem 
incluir listas, a LISP também é capaz de processamento 
hierarquico. Uma lista pode ser condicional, de modo a so 
“disparar” se os seus elementos forem satisfeitos. Desse 
modo, hierarquias de tais condicionantes podem ser usadas 
para identificar qualidades cada vez mais abstratas de um 
padrao. 

A LISP tornou-se mania na comunidade de inteligéncia 
artificial na década de 1970 e inicio da década de 1980. A 
ideia de linguagem que os entusiastas da LISP tinham na 
década de 1970 era que a linguagem refletia o modo de 
funcionamento do cérebro humano - que qualquer processo 
inteligente pode ser codificado com mais facilidade e 
eficiéncia em LISP. Seguiu-se uma miniexplosao de empresas 
de “inteligéncia artificial” que ofereciam intérpretes LISP e 
produtos LISP correlatos, mas quando ficou evidente, em 
meados da década de 1980, que a LISP nao era um atalho 
para a criagao de processos inteligentes, o balao de 
investimentos murchou. 

Acontece que os entusiastas da LISP nao estavam 
totalmente errados. Essencialmente, cada identificador de 
padroes do neocortex pode ser considerado uma declaracao 
LISP - cada uma constitul uma lista de elementos, e cada 
elemento pode ser outra lista. Portanto, 0 neocdrtex esta 
dedicado ao processamento de listas de natureza simbdlica, 
algo bem similar ao que acontece num programa LISP. Além 
disso, ele processa todos os 300 milhdoes de “declaracdes” 
semelhantes a LISP ao mesmo tempo. 

No entanto, havia duas caracteristicas importantes 
faltando no mundo da LISP, e uma delas era o aprendizado. 


Os programas LISP precisavam ser codificados linha por 
linha por programadores humanos. Houve tentativas de 
codificar programas LISP automaticamente usando diversos 
métodos, mas eles nao faziam parte do conceito da 
linguagem. O neocortex, por sua vez, programa-se a Si 
mesmo, preenchendo suas “declaragdes” (ou seja, as listas) 
com informacoes significativas e acionaveis a partir de sua 
propria experi€ncia e de seus’ prdprios elos de 
retroalimentacao. Esse 6 um principio fundamental do modo 
de funcionamento do neocdrtex: cada um de_ seus 
identificadores de padroes (ou seja, cada declaracao 
semelhante a LISP) 6 capaz de preencher sua propria lista e 
se conectar com outras listas, para cima e para baixo. A 
segunda diferenca esta nos parametros de tamanho. E 
possivel criar uma variante da LISP (codificada em LISP) que 
permita assimilar esses parametros, mas eles nao fazem 
parte da linguagem basica. 

A LISP é condizente com a filosofia original do campo da 
IA, que era descobrir soluc6es inteligentes para problemas e 
codifica-las diretamente em linguagens de computador. A 
primeira tentativa de criar um método auto-organizado que 
aprendesse com a experiéncia - redes neurais - nao teve 
sucesso porque nao oferecia um meio de modificar a 
topologia do sistema em resposta ao aprendizado. O Modelo 
Hierarquico Oculto de Markov proporcionou isso com 
eficiéncia através de seu mecaniSsmo de poda. Hoje, o 
HHMM, juntamente com seus primos matematicos, constitui 
uma parcela significativa do mundo da IA. 

Um corolario da observacao da semelhanca entre LISPea 
estrutura em listas do neocértex € um argumento lancado 
por aqueles que afirmam que o cérebro é demasiadamente 
complexo para nossa compreensao. Esses criticos alegam 


que o cérebro tem trilhédes de conexdes e, como cada uma 
deve estar ali especificamente por seu desenho, elas 
constituem o equivalente a trilhdes de linhas de cddigo. 
Como ja vimos, estimei que ha cerca de 300 milhées de 
processadores de padroes no neocortex - ou 300 milhdées de 
listas, naS quais cada elemento esta apontando para outra 
lista (ou, no nivel conceitual mais baixo, para um padrao 
basico e irredutivel fora do neocdrtex). Mas 300 milhdes 
ainda € um numero razoavelmente grande de declaracdes 
LISP e, de fato, € maior do que qualquer programa existente 
escrito por humanos. 

Todavia, precisamos ter em mente que essas listas nao 
estao efetivamente especificadas no desenho original do 
sistema nervoso. O cérebro cria sozinho essas listas, 
conectando automaticamente os niveis a partir de suas 
proprias experiéncias. Esse € o principal segredo do 
neocortex. Os processos que realizam essa auto-organizacao 
sao muito mais simples do que os 300 milhdes de 
declaragdes que constituem a capacidade do neocortex. 
Esses processos estao especificados no genoma. Como 
demonstro no capitulo 11, a quantidade de informacoes 
unicaS No genoma (apds uma compressao sem perdas) 
aplicada ao cérebro é de 25 milhdes de bytes, equivalente a 
menos do que um milhao de linhas de céddigo. A 
complexidade efetiva do algoritmo é¢ ainda menor do que 
iSSO, poiS a maioria dos 25 milhoes de bytes de informacao 
genética pertence as necessidades biolégicas dos neurénios, 
nao especificamente a sua capacidade de processamento de 
informacgao. No entanto, mesmo esses 25 milhdoes de bytes 
de informacao de _ projeto constituem um nivel de 
complexidade com o qual podemos lidar. 


Sistemas de memoria hierarquica 


Como discuti no capitulo 3, Jeff Hawkins e Dileep George em 
2003 e 2004 desenvolveram um modelo do neocdrtex 
incorporando listas hierarquicas, 0 que foi descrito no livro 
de Hawkins e Blakeslee de 2004, On intelligence. Uma 
apresentacao mais atualizada e muito elegante do método 
da meméria temporal hierarquica pode ser encontrada na 
dissertacao de doutorado de Dileep George, de 2008.12 A 
Numenta o implementou num sistema chamado NuPIC 
(Numenta Platform for Intelligent Computing, ou Plataforma 
Numenta para Computacao Inteligente) e desenvolveu o 
reconhecimento de padroes e sistemas inteligentes de 
prospeccao de dados para clientes como Forbes e a Power 
Analytics Corporation. Depois de trabalhar com a Numenta, 
George criou uma nova empresa chamada Vicarious 
Systems, com verbas do Founder Fund (administrado por 
Peter Thiel, o capitalista de investimentos de risco por tras 
do Facebook, e Sean Parker, o primeiro presidente do 
Facebook) e da Good Ventures, gerida por Dustin Moskovitz, 
cofundador do Facebook. George apresentou progressos 
significativos em processos automaticos de modelagem, 
aprendizado e reconhecimento de informacgdes com um 
numero substancial de hierarquias. Ele chamou seu sistema 
de “uma rede cortical recursiva” e planeja aplicacdes para 
robdtica e geracao de imagens médicas, entre outros 
campos. Em termos matematicos, a técnica de modelos 
hierarquicos ocultos de Markov é bastante similar a esses 
sistemas de memoria  hierarquica, especialmente se 
permitimos que o sistema HHMM organize suas proprias 
conexdoes entre mddulos de reconhecimento de padroes. 
Como mencionado antes, oS HHMM _ proporcionam um 
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elemento adicional importante, que @€ a modelagem da 
distribuigao esperada da magnitude (dentro de um 
continuum) de cada input ao computar a probabilidade de 
existéncia do padrao sendo analisado. Recentemente, fundei 
uma nova empresa chamada Patterns, Inc., que pretende 
desenvolver modelos neocorticais hierarquicos e auto- 
organizados, utilizando os HHMMs e técnicas analogas com o 
proposito de entender a linguagem natural. Uma énfase 
importante estara na capacidade do sistema de projetar 
suas proprias hierarquias, de forma similar a um neocortex 
bioldgico. O sistema que imaginamos vai ler continuamente 
uma ampla gama de materiais, como Wikipédia e outros 
recursos de conhecimento, além de ouvir tudo que vocé 
disser e de observar tudo que vocé escrever (desde que 
vocé permita). A meta @€ gue ele se torne um amigo 
prestativo para responder as suas perguntas - antes mesmo 
que vocé as formule - e dar-lhe informacées e sugestées 
uteis durante sua rotina diaria. 


A fronteira mével da IA: escalando a 
hierarquia de competéncia 


1.Um discurso longo e cansativo feito por uma 
espumosa cobertura de torta. 

2. Roupa usada por uma crianga, talvez a bordo de 
um navio de Opera. 

3. Procurado por uma onda de crime de 12 anos, 
devorando os soldados do rei Hrothgar; o oficial 
Beowulf foi designado para o caso. 


. Pode se desenvolver gradualmente na mente ou 
ser levado durante a gravidez. 

.Dia Nacional do Professor e Dia do Pareo de 
Kentucky. 

. Wordsworth disse que ela al¢a voo, mas nunca 
vagueia. 

. Palavra de quatro letras que designa o aparato de 
ferro no casco de um cavalo ou uma Caixa para 
distribuicao de cartas de jogo num cassino. 

.No terceiro ato de uma Opera de Verdi de 1846, 
esse Flagelo de Deus é apunhalado até a morte por 
sua amante, Odabella. 


- Exemplos de perguntas de /eopardy!, todas respondidas 
corretamente por Watson. As respostas sao: arenga de merengue, 
pinafore, Grendel, gestar, maio, cotovia, “shoe” (em inglés). No caso 
da oitava pergunta, Watson respondeu: “O que é Atila?” O 
apresentador respondeu dizendo: “Seja mais especifico”. Watson 
esclareceu dizendo: “O que é Atila, o Huno?”, o que esta correto. 


As técnicas do computador para decifrar as pistas de /eopardy! sao 
parecidas com as minhas. A maquina focaliza as palavras-chave da 
pista e varre sua memoria (no caso de Watson, um banco de dados 
com 15 terabytes de conhecimento humano) a procura de 
associagoes com essas palavras. Ele confere rigorosamente as 
principais hipdédteses com as informacgdes contextuais que pode 
reunir: O© nome da categoria; o tipo de resposta buscada; o 
momento, o lugar e o género sugeridos pela pista; e assim por 
diante. E quando ele se “sente” suficientemente seguro, decide 
apertar o botdo. Isso 6 um processo instantaneo e intuitivo para um 
jogador humano de /Jeopardy!, mas estou convencido de que 
debaixo do capéd meu cérebro estava fazendo mais ou menos a 
mesma coisa. 


- Ken Jennings, campeao humano de J/eopardy!, que perdeu para 
Watson 


No meu caso, eu dou as boas-vindas a nossos novos senhores 

roboticos. 
- Ken Jennings, parafraseando Os Simpsons, depois de perder para 
Watson 


Meu Deus. [Watson] é mais inteligente do que o jogador mediano de 
Jeopardy! para responder as perguntas de Jeopardy! E algo 
inteligente de uma maneira impressionante. 

- Sebastian Thrun, ex-diretor do Laboratério de IA de Stanford 


Watson nao entende nada. Ele 6 um grande rolo compressor. 
- Noam Chomsky 


A inteligéncia artificial esta a nossa volta - nao temos mais a 
mao na tomada. O simples ato de nos conectarmos com 
alguém por meio de uma mensagem de texto, e-mail ou 
celular usa algoritmos inteligentes para direcionar a 
informacgao. Quase todo produto que tocamos foi desenhado 
originalmente por uma colaboracgao entre inteligéncias 
humanas e artificiais, e depois construido em fabricas 
automatizadas. Se todos os sistemas de IA decidissem entrar 
em greve amanha, nossa civilizacao ficaria aleijada: nao 
conseguiriamos tirar dinheiro do banco, e, na verdade, nosso 
dinheiro desapareceria; comunicagdes, transportes e 
fabricas parariam completamente. Felizmente, nossas 
maquinas inteligentes ainda nao sao_ inteligentes o 
suficiente para organizarem uma conspiracao dessas. 

O que 6 novo na atual IA 6 a natureza visceralmente 
impressionante de exemplos abertos ao publico. Pense, por 
exemplo, nos carros autodirigidos do Google (que, enquanto 
escrevo, ja percorreram mais de 320 mil quil6metros em 
cidades grandes e pequenas), uma tecnologia que levara a 


um numero muito menor de colisées, a otimizacao da 
capacidade das estradas, ao alivio humano da tarefa de 
dirigir e a muitos outros beneficios. Carros sem motoristas ja 
podem operar legalmente em vias publicas de Nevada com 
algumas restricdes, embora 0 uso amplo e publico em escala 
mundial sé seja esperado no final desta década. A 
tecnologia que observa com intelig@ncia as vias e avisa o 
motorista de possiveis perigos ja esta sendo instalada em 
carros. Uma dessas tecnologias se baseia em parte no bem- 
sucedido modelo de processamento visual do cérebro criado 
por Tomaso Poggio, do MIT. Chamado MobilEye, foi 
desenvolvido por Amnon Shashua, gue foi aluno de pos- 
doutorado de Poggio. Ele consegue alertar o motorista de 
perigos como uma colisao iminente ou uma crianga correndo 
na frente do carro, e recentemente foi instalado em carros 
das marcas Volvo e BMW. 

Vou focalizar as tecnologias da linguagem nesta secao do 
livro por varios motivos. Nao deve surpreender ninguém o 
fato de a natureza hierarquica da linguagem refletir de perto 
a natureza hierarquica de nosso pensamento. A linguagem 
falada foi nossa primeira tecnologia, e a linguagem escrita, a 
segunda. Meu trabalho pessoal na inteligéncia artificial, 
como este capitulo demonstrou, tem _ focalizado 
intensamente a linguagem. Finalmente, o dominio da 
linguagem @ uma capacidade com enorme alavancagem. 
Watson ja leu centenas de milhées de paginas na Internet e 
dominou o conhecimento contido nesses documentos. Em 
ultima analise, as mMaquinas serao capazes de dominar todo 
0 conhecimento na Internet - que 46, em esséncia, todo o 
conhecimento de nossa civilizagao homem-maquina. 

O matematico inglés Alan Turing (1912-1954) baseou seu 
teste homdnimo na capacidade de um computador 


conversar em linguagem natural usando mensagens de 
texto [13]. Turing achava que toda a inteligéncia humana 
estava incorporada a linguagem e era representada por ela, 
e que nenhuma maquina poderia passar pelo teste de Turing 
com simples truques de linguagem. Embora o teste de 
Turing seja um jogo envolvendo a linguagem escrita, Turing 
acreditava que a Unica maneira para um computador passar 
pelo teste seria possuir, de fato, uma inteligéncia de nivel 
equivalente a humana. Os criticos propuseram que um 
verdadeiro teste de inteligéncia de nivel humano também 
deveria incluir o dominio de informac6ées viSuais e auditivas. 
Como boa parte de meus proprios projetos de IA envolve 
ensinar computadores a dominar informacoes sensoriais 
como a fala humana, formas de letras e sons musicais, 
esperar-se-ia que eu defendesse a inclusao dessas formas de 
informagao num verdadeiro teste de inteligéncia. Mas 
concordo com a observacao original de Turing, de que a 
versao apenas textual do teste de Turing é€ suficiente. O 
acréscimo de inputs ou outputs visuais Ou auditivos ao teste 
nao o tornaria mais dificil. 

Nao € preciso ser um especialista em IA para ficar 
sensibilizado com o desempenho de Watson em Jeopardy! 
Embora eu compreenda razoavelmente a metodologia 
utilizada em diversos de seus subsistemas principais, isso 
nao diminui minha reag¢ao emocional ao observar esse 
negocio - e/e? - trabalhando. Até a compreensao perfeita do 
funcionamento de todos os seus sistemas componentes - 
algo que ninguém tem - nao ajudaria a prever como Watson 
poderia reagir de fato a uma situacao especifica. Ele contém 
centenas de subsistemas interativos, e cada um deles 
analisa milhdes de hipdéteses concorrentes ao mesmo tempo, 
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de modo que é impossivel prever um resultado. Fazer uma 


analise completa - apds o fato - das deliberagcdes de Watson 
para uma Unica pergunta de trés segundos levaria séculos 
para um humano. 

Dando continuidade a minha propria histdria, no final da 
década de 1980 e na seguinte, comecamos a trabalhar com 
a compreensao de linguagem natural em areas limitadas. 
Vocé poderia conversar com um de _ nossos_ produtos, 
chamado Kurzweil Voice, a respeito de qualquer coisa que 
quisesse, desde que se referisse a edi¢ao de documentos. 
(Por exemplo, “mova para ca o terceiro paragrafo da pagina 
anterior”.) Funcionou muito bem nessa area limitada, mas 
util. Também criamos sistemas com conhecimentos na area 
médica para que médicos pudessem ditar relatdérios sobre 
pacientes. Ele tinha conhecimentos suficientes sobre 
Campos como radiologia e patologia para questionar o 
médico caso alguma coisa no relatério parecesse confusa, e 
orientava o médico no processo de criacao do relatorio. 
Esses sistemas de relatdrios médicos evoluiram e se 
tornaram um negécio de um bilhao de ddolares para a 
Nuance. 

Compreender a linguagem natural, especialmente como 
uma extensao do reconhecimento automatico de fala, € uma 
coisa que se tornou convencional. Enquanto escrevo este 
livro, Siri, a assistente pessoal automatica do iPhone 4S, 
criou uma comocao no mundo da computacao mével. Vocé 
pode pedir que Siri faca qualquer coisa que um smartphone 
de respeito deve ser capaz de fazer (por exemplo, “onde 
posso encomendar comida indiana perto daqui?”, ou 
“mande uma mensagem de texto para minha mulher e diga 
que estou a caminho”, ou “o que as pessoas estao dizendo 
sobre o novo filme do Brad Pitt?”), e na maior parte das 
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vezes, Siri vai responder. Siri também é capaz de bater 


papo. Se vocé lhe perguntar qual o sentido da vida, ela vai 
responder ”42”, que os fas do filme O guia do mochileiro da 
galaxia vao reconhecer como a “resposta para a questao 
maior da vida, do universo e tudo o mais”. Perguntas de 
conhecimento (inclusive essa sobre o sentido da vida) sao 
respondidas por Wolfram Alpha, descrito na pagina 209. Ha 
todo um mundo de “chatbots” que nao fazem nada exceto 
manter conversas fiadas. Se vocé quiser conversar com 
nossa chatbot chamada Ramona, va ao nosso website 
KurzweilAl.net e clique em “Chat with Ramona”. 

Algumas pessoas reclamaram comigo sobre o fato de Siri 
nao conseguir responder a certos pedidos, mas lembro-me 
de que sao aS mesmas pessoas que também costumam 
reclamar insistentemente sobre provedores humanos de 
servicos. As vezes, sugiro que tentemos fazé-lo juntos, e 
geralmente funciona melhor do que eles esperam. As 
reclamac6es me fazem lembrar da histéria do cachorro que 
sabia jogar xadrez. Para um interlocutor incrédulo, o dono do 
cachorro responde “Sim, é verdade, ele joga xadrez, mas seu 
final de jogo @é fraco”. Estao surgindo concorrentes 
eficientes, como o Google Voice Search. 

O fato de o publico em geral estar conversando em 
linguagem falada natural com seus computadores portateis 
assinala uma nova era. E normal as pessoas menosprezarem 
a importancia da primeira geragao de uma tecnologia em 
virtude de suas limitagoes. Alguns anos depois, quando a 
tecnologia funciona direito, as pessoas ainda menosprezam 
Sua importancia porque, bem, ela nao é mais nova. Dito isso, 
Siri funciona impressionantemente bem para um produto de 
primeira geracao, e esta claro que essa categoria de produto 
sO vai melhorar. 


Siri uSa as tecnologias de reconhecimento de fala com 
base em HMM da Nuance. As extensdes em linguagem 
natural foram desenvolvidas inicialmente pelo projeto 
“CALO”, financiado pela DARPA. Siri foi refor¢ada com as 
tecnologias de linguagem natural da prépria Nuance, e esta 
oferece uma tecnologia bem semelhante chamada Dragon 
Go! [16] 

Os métodos usados para se compreender a linguagem 
natural sao muito similares aos modelos hierarquicos ocultos 
de Markov, e, de fato, o prdprio HHMM é_ usado 
habitualmente. Embora alguns desses sistemas nao revelem 
especificamente que usam HMM ou HHMM, a matematica é 
praticamente id@ntica. Todos envolvem hierarquias de 
sequéncias lineares nas quais cada elemento tem um peso, 
conexées que sao autoadaptaveis e um sistema geral que se 
organiza sozinho com base em dados de aprendizado. 
Geralmente, 0 aprendizado continua durante o uso efetivo 
do sistema. Essa abordagem se ajusta a_ estrutura 
hierarquica da linguagem natural: € apenas uma extensao 
natural num ponto superior da escala conceitual, indo de 
partes da fala para palavras, para frases e para estruturas 
semanticas. Faria sentido executar um algoritmo genético 
sobre oS parametros que controlam o algoritmo preciso de 
aprendizado dessa classe de sistemas hierarquicos de 
aprendizado e determinam os detalhes algoritmicos ideais. 

Na ultima década, houve uma mudanca na maneira como 
essas estruturas hierarquicas sao criadas. Em 1984, Douglas 
Lenat (nascido em 1950) fundou o ambicioso projeto Cyc (de 
enCyYClopedic, ou “enciclopédico”), que viSava criar regras 
que codificariam todo conhecimento derivado do “senso 
comum”. As regras foram organizadas numa _ grande 
hierarquia, e cada regra envolvia - maiS uma vez - uma 


sequéncia linear de estados. Por exemplo, uma regra de Cyc 
pode dizer que um cao tem uma cara. Cyc pode associar isso 
a regras gerais sobre a estrutura de caras: que uma cara tem 
dois olhos, nariz, boca e assim por diante. Nao precisamos 
criar um conjunto de regras para a cara de um cao e outra 
para a cara de um gato, embora possamos, evidentemente, 
acrescentar regras extras para a maneira pela qual as caras 
de caes diferem das caras de gatos. O sistema também 
inclui um mecanismo de inferéncia: se temos regras que 
dizem que um cocker spaniel € um cao, que caes sao 
animais e que animais comem comida, e se perguntassemos 
ao mecanismo de inferéncia se cocker spaniels comem, o 
sistema responderia que sim, cocker spaniels comem 
comida. Nos 20 anos seguintes, e com milhares e milhares 
de horas de trabalho, mais de um milhao de regras desse 
tipo foram escritas e testadas. E interessante observar que a 
linguagem usada para escrever as regras de Cyc - chamada 
CycL - 6 quase idéntica a LISP. 

Enquanto isso, uma escola oposta de pensamento 
acreditava que a melhor abordagem para a compreensao da 
linguagem natural, e para a criacgao de sistemas inteligentes 
em geral, seria Oo aprendizado automatico mediante a 
exposi¢ao a um numero bastante grande de exemplos dos 
fendmenos que o sistema estaria tentando dominar. Um 
exemplo poderoso desse tipo de sistema € o Google 
Translate, que pode traduzir de e para 50 linguas. Sao 2.500 
direcoes diferentes de traducao, embora, na maioria dos 
pares de linguas, em vez de traduzir da lingua 1 
diretamente para a lingua 2, o sistema traduza primeiro a 
lingua 1 para o inglés e depois o inglés para a lingua 2. Isso 
reduz a 98 o numero de tradutores de que o Google precisa 
se valer (alam de um numero limitado de pares nao ingleses 


para oS quais existe uma traducao direta). Os tradutores do 
Google nao usam regras gramaticais; com efeito, criam 
amplos bancos de dados para cada par de linguas contendo 
tradugoes comuns, com base num grande corpo de 
documentos traduzidos entre as duas linguas, como uma 
“pedra de Rosetta”. Para as seis linguas que constituem as 
linguas oficiais das Nacdes Unidas, o Google usou 
documentos das Nacoes Unidas, que sao publicados nessas 
seis linguas. Para linguaS menos comuns, foram usadas 
outras fontes. 

Os resultados costumam ser impressionantes. A DARPA 
promove competico6es anuais para os melhores sistemas de 
traducao automatica de linguas para diferentes pares de 
linguas, e o Google Translate costuma vencer no caso de 
certos pares, com um desempenho melhor do que sistemas 
criados diretamente por linguistas humanos. 

Na ultima década, duas ideias importantes influenciaram 
profundamente o campo da compreensao da linguagem 
natural. A primeira tem relagao com as hierarquias. Embora 
a abordagem do Google tenha comecado com a associacgao 
de sequéncias simples de palavras entre uma lingua e outra, 
a natureza intrinsecamente hierarquica da linguagem 
acabou_ interferindo inevitavelmente nessa operacao. 
Sistemas que incorporam metodicamente um aprendizado 
hierarquico (como os modelos hierarquicos ocultos de 
Markov) proporcionaram um resultado significativamente 
melhor. Entretanto, tais sistemas nao sao tao automaticos 
assim para se elaborar. Assim como os humanos precisam 
aprender aproximadamente uma hierarquia conceitual de 
cada vez, 0 mesmo se aplica a sistemas computadorizados, 
de modo que o processo de aprendizado precisa ser 
administrado com cuidado. 


A outra ideia é que regras feitas a mao funcionam bem 
para um nucleo de conhecimentos basicos e comuns. Para a 
traducao de trechos curtos, essa postura costuma dar 
resultados mais precisos. A DARPA, por exemplo, obteve 
notas melhores para tradutores do chinés para o inglés com 
base em regras do que 0 Google Translate em trechos curtos. 
No caso da “cauda” de uma lingua, que se refere aos 
milhoes de frases e conceitos pouco frequentes usados nela, 
a precisao dos sistemas com base em regras aproxima-se de 
uma assintota inaceitavelmente baixa. Se representarmos 
num grafico a precisao da compreensao da linguagem 
natural versus o tempo de treinamento de_ sistemas 
baseados em regras com analise de dados, estes terao um 
desempenho inicial superior, mas depois deverao se manter 
numa precisao em torno de 70%. Em contraste nitido, 
sistemas estatisticos podem atingir uma precisao de mais de 
90%, mas exigem muitos dados para isso. 

Normalmente, precisamos de uma combinacgao de 
desempenho moderado, no minimo, sobre uma pequena 
quantidade de dados de treinamento, e depois a 
oportunidade de atingir precisOes maiores com uma 
quantidade mais significativa. Atingir rapidamente um 
desempenho moderado permite-nos colocar o sistema em 
campo, coletando automaticamente dados de treinamento a 
medida que as pessoas 0 usam efetivamente. Desse modo, é 
possivel haver bastante aprendizado ao mesmo tempo em 
que o sistema esta sendo usado, e sua precisao vai 
aumentar. O aprendizado estatistico precisa ser plenamente 
hierarquico para refletir a natureza da linguagem, o que 
também reflete o modo como o cérebro humano funciona. 

Também é€ esse o modo como Siri e Dragon Go! 
funcionam: usando regras para os fenédmenos mais comuns e 


confiaveis, aprendendo depois a “cauda” da linguagem nas 
maos de usuarios reais. Quando a equipe do Cyc percebeu 
que tinham atingido um teto de desempenho baseando-se 
em regras codificadas a mao, eles também adotaram essa 
abordagem. As regras codificadas a mao proporcionam duas 
funcgoes essenciais. Oferecem uma precisao inicial adequada 
a ponto de o sistema em teste poder ser posto em 
funcionamento, melhorando automaticamente com isso. 
Segundo, dao uma base solida para os niveis mais baixos da 
hierarquia conceitual, e assim o aprendizado automatico 
pode comecar a aprender niveis conceituais mais elevados. 

Como mencionei antes, Watson representa um exemplo 
particularmente impressionante da abordagem que combina 
regras codificadas manualmente com _ aprendizado 
hierarquico estatistico. A IBM combinou diversos programas 
importantes de linguagem natural para criar um sistema 
Capaz de jogar /eopardy!, um jogo em linguagem natural. 
Entre os dias 14 e 16 de fevereiro de 2011, Watson competiu 
com os dois principais jogadores humanos: Brad Rutter, que 
ganhou mais dinheiro do que qualquer outra pessoa nesse 
jogo de perguntas, e Ken Jennings, que deteve o titulo de 
Jeopardy! pelo tempo recorde de 75 dias. 
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Quantidade de dados de treinamento 


Precisao dos sistemas de compreensao de linguagem natural como funcdao da 
quantidade de dados de treinamento. A melhor abordagem consiste em 
combinar regras para o “nucleo” da linguagem e uma postura baseada em 
dados para a “cauda” da linguagem 


A titulo de contexto, eu previ em meu primeiro livro, The 
age of intelligent machines, escrito em meados da década 
de 1980, que um computador venceria o campeonato 
mundial de xadrez até 1998. Previ ainda que, quando isso 
acontecesse, ou _ piorariamos nossa opiniao sobre a 
intelig@ncia humana e melhorarfamos nossa opiniao sobre a 
inteligéncia das maquinas, Ou menosprezariamos a 
importancia do xadrez, e que, se a historia pudesse servir de 
guia, Minimizariamos o xadrez. As duas coisas aconteceram 
em 1997. Quando o supercomputador de xadrez da IBM, o 
Deep Blue, derrotou 0 campeao mundial humano de xadrez 
da @poca, Garry Kasparov, vimos imediatamente uma 


enxurrada de argumentos alegando que era de se esperar 
que um computador vencesse no xadrez, pois computadores 
sao Maquinas ldgicas e 0 xadrez é, afinal de contas, um jogo 
de ldgica. Por isso, a vitéria do Deep Blue nao foi 
considerada nem surpreendente, nem importante. Muitos de 
seus criticos disseram que os computadores nunca 
chegariam a dominar as sutilezas da linguagem humana, 
inclusive metaforas, analogias, trocadilhos, duplos sentidos 
e humor. 

Existe pelo menos um motivo para que Watson 
represente um marco tao importante: Jeopardy! é 
precisamente uma tarefa linguistica com esse grau de 
sofisticagao e de desafio. As perguntas tipicas de /eopardy! 
incluem muitas dessas excentricidades da _ linguagem 
humana. O que nao deve ficar tao evidente para muitos 
observadores € que Watson teve nao so de dominar a 
linguagem nas perguntas inesperadas e complexas, como, 
na maioria das vezes, seu conhecimento nao foi codificado a 
mao. Ele amealhou esse conhecimento lendo de fato 200 
milhédes de paginas de documentos em linguagem natural, 
inclusive toda a Wikipédia e outras’ enciclopédias, 
abrangendo 4 trilhoes de bytes de conhecimentos baseados 
na linguagem. Como os leitores deste livro sabem muito 
bem, a Wikipédia nao esta escrita em LISP ou em CycL, mas 
em frases naturais, com todas as ambiguidades e 
complexidades inerentes a linguagem. Watson precisou 
levar em conta todos os 4 trilhOes de caracteres de seu 
material de refer€ncia ao responder a uma _ pergunta. 
(Percebi que as perguntas de /eopardy! sao respostas a 
procura de uma questdo, mas isso 6 um aspecto técnico - no 
final, sao mesmo questédes.) Se Watson pode compreender e 
responder a perguntas com base em 200 milhdes de paginas 


- em trés segundos! - nao ha nada que possa impedir 
sistemas similares de ler os outros bilhodes de documentos na 
Internet. Na verdade, esse esforco ja esta sendo feito. 

Quando estavamos  desenvolvendo' sistemas de 
reconhecimento de caracteres e de fala e os primeiros 
sistemas de compreensao de linguagem natural entre as 
décadas de 1970 e de 1990, usamos a metodologia que 
consiste em incorporar um “gerenciador especialista”. 
Desenvolvemos diversos sistemas para fazer a mesma coisa, 
mas incorporamos abordagens um pouco diferentes em cada 
uma. Algumas das diferencas eram sutis, como variacgoes 
nos parametros controlando a matematica do algoritmo de 
aprendizado. Algumas variacgoes eram fundamentais, como a 
inclusao de sistemas baseados em regras em vez de 
sistemas de aprendizado_ estatistico hierarquico. O 
gerenciador especialista era um software programado para 
aprender as forcas e as fraquezas desses_ sistemas 
diferentes, examinando seu desempenho em situac6es do 
mundo real. BaSeava-se na ideia de que essas forcas eram 
ortogonais, ou seja, um sistema tenderia a ser forte naquilo 
em que outro era fraco. Com efeito, o desempenho global 
dos sistemas combinados com o gerenciador especialista 
treinado foi bem melhor do que o de qualquer sistema 
individual. 

Watson funciona do mesmo modo. Usando uma 
arquitetura chamada Unstructured Information Management 
Architecture (UIMA, Arquitetura de gerenciamento de 
informacgao nao estruturada), Watson emprega literalmente 
centenas de sistemas diferentes - muitos dos componentes 
individuais de linguagem do Watson sao os mesmos usados 
em sistemas de compreensao de linguagem natural 
disponiveis publicamente -, todos tentando encontrar 


diretamente uma resposta para a pergunta do /eopardy!, ou 
pelo menos apresentar alguma desambiguacao da pergunta. 
O UIMA esta agindo basicamente como o $gerenciador 
especialista para combinar de forma  inteligente os 
resultados dos sistemas independentes. O UIMA vai muito 
além dos sistemas anteriores, tal como aquele que 
desenvolvemos na empresa que antecedeu a Nuance, pois 
seus sistemas individuais podem contribuir para um 
resultado sem encontrarem necessariamente uma resposta 
final. E suficiente se um subsistema ajuda a reduzir as 
solucdes. O UIMA também consegue calcular 0 grau de 
confianca na resposta final. O cérebro humano também faz 
isso; provavelmente, temos muita confiangca em nossa 
resposta quando nos perguntam o nome de nossa mae, mas 
nao tanta quando precisamos nos lembrar do nome de 
alguém que conhecemos informalmente ha um ano. 

Assim, em vez de descobrir uma unica abordagem 
elegante para compreender o problema de linguagem 
inerente ao Jeopardy!, os cientistas da IBM combinaram 
todos os mddulos mais avancgados de compreensao da 
linguagem que puderam encontrar. Alguns usam os Modelos 
Hierarquicos Ocultos de Markov; outros usam variantes 
matematicas do HHMM; outros usam abordagens baseadas 
em regras para codificarem diretamente um conjunto central 
de regras confiaveis. O UIMA avalia o desempenho de cada 
sistema no seu uso real e 0S combina de maneira otimizada. 
Ha certo equivoco nas discussdes publicas de Watson, pois 
os cientistas da IBM que o criaram costumam se concentrar 
no UIMA, o gerenciador especialista criado por eles. Isso 
levou alguns observadores a comentar que o Watson nao 
compreende de fato a linguagem, pois é dificil identificar 
onde esta essa compreensao. Apesar de a estrutura do UIMA 


também aprender com sua _ propria experiéncia, a 
“compreensao” de linguagem do Watson nao pode ser 
encontrada apenas no UIMA, mas esta distribuida através de 
todos os seus varios Componentes, inclusive os méddulos 
auto-organizados de linguagem que usam métodos similares 
ao HHMM. 

Uma parte separada da tecnologia de Watson usa a 
estimativa de confianca do UIMA em suas respostas para 
determinar a forma de fazer as apostas do /eopardy! Embora 
o sistema do Watson seja otimizado especificamente para 
jogar esse jogo especifico, sua tecnologia central de busca 
de linguagem e de conhecimento pode ser adaptada 
facilmente para realizar outras tarefas amplas. Poder-se-ia 
pensar que um _- conhecimento _ profissional menos 
compartilhado, como aquele pertencente a area médica, 
seria mais dificil de ser dominado do que o conhecimento 
“comum” e de propdésitos gerais necessario para jogar 
Jeopardy! Na verdade, € o contrario: o conhecimento 
profissional tende a ser mais organizado, estruturado e 
menos ambiguo do que seu equivalente do senso comum; 
desse modo, o uso dessas técnicas é altamente sucetivel a 
compreensao precisa de uma linguagem natural. Como 
disse, atualmente a IBM esta trabalhando junto com a 
Nuance para adaptar a tecnologia do Watson a medicina. 

A conversa que acontece quando Watson joga Jeopardy! 
€ breve: faz-se uma pergunta e Watson produz uma 
resposta. (Novamente, em termos técnicos, ele produz uma 
questao que corresponde a uma resposta.) Ele nao participa 
de uma conversa, 0 que exigiria 0 acompanhamento de 
todas as declaracoes anteriores de todos os participantes. 
(Na verdade, Siri faz isso até certo ponto: se vocé pedir que 
ela mande uma mensagem para sua esposa, ela vai lhe 


pedir para identifica-la, mas vai se lembrar de quem ela é 
em pedidos posteriores.) O acompanhamento de todas as 
informagoes de uma conversa - uma tarefa que seria 
claramente exigida para se passar pelo teste de Turing - é 
um requisito adicional importante, mas fundamentalmente 
nao mais dificil do que aquilo que Watson ja esta fazendo. 

Em suma, Watson leu centenas de milhdes de paginas de 
material, que obviamente incluem muitas histdrias, e por 
isso. ele @ capaz de _ rastrear eventos sequenciais 
complicados. Portanto, deveria ser capaz de acompanhar 
Suas propriaS conversas e leva-las em conta em suas 
respostas subsequentes. 

Outra limitacao do jogo de Jeopardy! 6 que as respostas 
costumam ser breves: ele nao faz, por exemplo, perguntas 
do tipo que leva os concorrentes a dar 0 nome dos cinco 
temas primarios de Um conto das duas cidades. Para poder 
encontrar documentos que discutem efetivamente os temas 
desse romance, uma versao adequadamente modificada de 
Watson deveria poder responder a essa pergunta. Encontrar 
sozinho tais temas apenas pela leitura do livro, e nao 
copiando os pensamentos (mesmo sem as palavras) de 
outros pensadores, ja é outra historia. Fazé-lo constituiria 
uma tarefa de nivel superior aguela de que Watson é capaz 
hoje em dia - seria uma tarefa que eu consideraria do nivel 
do teste de Turing. (Dito isso, devo lembrar que a maioria 
dos seres humanos tampouco apresenta seus prdprios 
pensamentos originais, mas copia as ideias de seus pares e 
de formadores de opiniao.) Seja como for, estamos em 2012 
(sic) e nao em 2029, e por isso eu ainda nao esperaria uma 
intelig@ncia do nivel do teste de Turing. Por outro lado, eu 
diria que a avaliagao das respostas a perguntas, como a 
descoberta das principais ideias de um romance, nao é, em 


si, uma tarefa objetiva. Se perguntarmos a alguém quem 
assinou. a_ ODeclaracao de _ Independéncia, podemos 
determinar se a resposta da pessoa é verdadeira ou falsa. A 
validade de respostas a perguntas de nivel superior, como a 
descri¢ao dos temas de uma obra criativa, 6 determinada 
com mais dificuldade. 

E interessante notar que apesar das_ habilidades 
linguisticas de Watson ficarem um pouco abaixo daquelas de 
um humano instruido, ele conseguiu derrotar os dois 
melhores jogadores de /eopardy! do mundo. A vit6éria se 
deve a capacidade de combinar sua habilidade linguistica e 
Sua compreensao de conhecimentos com aé_ recordacao 
perfeita e aS memorias altamente precisas que aS maquinas 
possuem. E por isso que ja transferimos para elas nossas 
memorias pessoais, sociais e hist6ricas. 

Apesar de eu nao estar preparado para alterar minha 
previsao de um computador passando pelo teste de Turing 
em 2029, o progresso feito em sistemas como Watson deve 
nos dar uma boa confianc¢a de que o advento da IA de nivel 
de Turing esta proximo. Se pudermos criar uma versao de 
Watson otimizada para o teste de Turing, provavelmente 
estariamos bem prdéximos. 

O fildsofo norte-americano John Searle (nascido em 1932) 
disse recentemente que Watson nao é capaz de pensar. 
Citando seu experimento mental do “quarto chinés” (que 
vou comentar em detalhe no capitulo 11), ele afirma que 
Watson apenas manipula simbolos sem compreender seu 
significado. Na verdade, Searle nao esta descrevendo 
Watson com precisSao, pois Sua compreensao da linguagem 
se baseia em processos estatisticos hierarquicos - e nao na 
manipulagao de simbolos. A Unica maneira de a 
caracterizacao de Searle ser precisa seria considerarmos 


cada etapa dos processos de auto-organizacao de Watson 
uma “manipulagao de simbolos”. Mas, se fosse assim, Oo 
cérebro humano também nao seria considerado capaz de 
pensar. 

E divertido e irdénico ver os observadores criticando 
Watson por fazer apenas uma analise estatistica da 
linguagem, diferentemente de possuir a “verdadeira” 
compreensao da linguagem que os humanos possuem. A 
analise estatistica hierarquica 6 exatamente o que o cérebro 
humano faz ao resolver hipdteses multiplas com base em 
inferéncia estatistica (e, na verdade, em todos os niveis da 
hierarquia neocortical). Tanto Watson como o cérebro 
humano aprendem e respondem com base numa abordagem 
similar a compreensao hierarquica. Em muitos aspectos, o 
conhecimento de Watson € bem mais extenso do que o de 
um humano; nenhum humano pode afirmar que dominou 
toda a Wikipédia, que é€ apenas parte da base de 
conhecimentos de Watson. Por outro lado, hoje um humano 
pode dominar mais niveis conceituais do que Watson, mas 
certamente essa lacuna nao é permanente. 

Um sistema importante que demonstra a forca da 
computacao aplicada ao conhecimento organizado é€ o 
Wolfram Alpha, um mecanismo de respostas (distinto de um 
mecanismo de pesquisa) desenvolvido pelo dr. Wolfram 
(nascido em 1959), matematico e cientista britanico, e seus 
colegas da Wolfram Research. Se vocé perguntar ao Wolfram 
Alpha (em WolframAlpha.com), por exemplo, “quantos 
numeros primos ha abaixo de um milhao?” ele vai responder 
“78.498”. Ele nao procurou a resposta, ele a calculou e, apds 
a resposta, ele mostra as equacgdes que usou. Se tentarmos 
obter essa resposta usando um mecanismo de pesquisa 
convencional, ele nos. direcionaria para links onde 


encontrariamos os algoritmos necessarios. Entao, terfamos 
de conectar essas férmulas a um _ sistema como o 
Mathematica, também desenvolvido pelo dr. Wolfram, mas 
obviamente isso- exigiria muito mais trabalho (e 
compreensao) do que a mera pergunta ao Alpha. 

Com efeito, o Alpha consiste em 15 milh6des de linhas de 
cédigo do Mathematica. O que o Alpha faz, literalmente, é 
calcular a resposta a partir de aproximadamente 10 trilhoes 
de bytes de dados que foram cuidadosamente selecionados 
pela equipe da Wolfram Research. Vocé pode fazer uma 
grande variedade de perguntas factuais, como “que pais 
tem a maior renda per capita?” (Resposta: Ménaco, com US$ 
212 mil por pessoa), ou “Qual a idade de Stephen Wolfram?” 
(Resposta: 52 anos, 9 meses e 2 diaS no momento em que 
escrevo isto). Como mencionei, o Alpha € usado como parte 
da Siri, da Apple; se vocé fizer uma pergunta factual para 
Siri, ela € passada para Alpha, que a responde. O Alpha 
também trata de algumas das pesquiSas apresentadas ao 
mecanismo de pesquisa do Bing, da Microsoft. 

Num post recente de seu blog, o dr. Wolfram disse que 
agora oO Alpha apresenta respostas bem-sucedidas em 90% 
dos casos [17]. Ele também informa que houve uma queda 
exponencial no indice de falhas, com um periodo médio de 
18 meses. E um sistema impressionante, que usa métodos 
artesanaiS e dados conferidos a mao. Trata-se de um 
testemunho do motivo pelo qual criamos computadores. Na 
medida em que descobrimos e compilamos métodos 
cientificos e matematicos, os computadores se mostram bem 
melhores em implementa-los do que a inteligéncia humana 
desassistida. Muitos dos métodos cientificos conhecidos 
foram codificados no Alpha, juntamente com _ dados 
continuamente atualizados sobre tdpicos que vao da 


economia a fisica. Numa conversa particular que tive com o 
dr. Wolfram, ele estimou que métodos auto-organizados 
como esses usados no Watson costumam atingir uma 
precisao de 80% quando estao funcionando bem. Segundo 
disse, o Alpha esta préximo de 90% de precisao. E claro que 
existe uma autosselecao nos dois indices de precisao, pois 
oS usuarios (Como eu) ja sabem em que tipo de questdes o 
Alpha tem bom desempenho, e um fator similar se aplica aos 
métodos auto-organizados. Oitenta por cento parece uma 
estimativa razoavel da precisao de Watson nas perguntas de 
Jeopardy!, mas foi suficiente para vencer os melhores 
humanos. 

Acredito que métodos auto-organizados como os que 
sistematizei na teoria da mente baseada no reconhecimento 
de padroes sao necessarios para se compreender as 
hierarquias complexas e geralmente ambiguas que 
encontramos em fendmenos do mundo real, inclusive na 
linguagem humana. Uma combinacao ideal para um sistema 
de inteligéncia robusta seria aliar a inteligéncia hierarquica 
baseada em TMRP (que, segundo afirmo, € 0 modo como o 
cérebro humano funciona) a codificagcao precisa do 
conhecimento e dos dados cientificos. Essencialmente, isso 
descreve um humano com um computador. Vamos aprimorar 
os dois polos de inteligéncia nos préximos anos. Com relacgao 
a nossa inteligéncia bioldgica, apesar de nosso neocortex ter 
bastante plasticidade, sua arquitetura basica é limitada por 
suas restricoes fisicas. Desenvolver um neocortex maior na 
testa foi uma inovacao evolutiva importante, mas hoje nao 
podemos expandir com facilidade o tamanho de nossos 
lobos frontais por um fator de mil, nem mesmo de 10%. Quer 
dizer, nao podemos fazé-lo biologicamente, mas é 
exatamente isso que faremos tecnologicamente. 


Estratégia para a criacao de uma mente 


Nosso cérebro contém bilhdes de neurénios, mas o que sao os 
neurénios? Apenas células. O cérebro sé tem conhecimento quando 
se formam conex6ées entre os neurdnios. Tudo aquilo que sabemos, 
tudo que somos, provém do modo como nossos neurénios se 
conectam. 

- Tim Berners-Lee 


Vamos usar as observacoes que discuti antes para comecar a 
construir um cérebro. Partiremos da constru¢ao de um 
identificador de padroes que preencha os_ atributos 
necessarios. Depois faremos tantas cdpias do identificador 
quanto nossa memoria e nossos recursos computacionais 
puderem  suportar. Cada _ identificador calcula a 
probabilidade de que seu padrao tenha sido identificado. Ao 
fazé-lo, leva em conta a magnitude observada de cada input 
(num continuum apropriado) e pareia essa informacao com o 
tamanho aprendido e com os parametros de variacao de 
tamanho associados a cada /nput. O identificador dispara 
seu axdnio simulado se a probabilidade calculada excede 
um limiar. Esse limiar e os parametros que controlam o 
calculo da probabilidade do padrao encontram-se entre os 
parametros que otimizaremos com um algoritmo genético. 
Como nao é uma exigéncia que cada input se mantenha 
ativo para que um padrao seja identificado, isso proporciona 
um _reconhecimento autoassociativo (ou sSséeja, oO 
reconhecimento de um padrao com base apenas na 
presenca de parte do padrao). Também reservamos uma 
margem para sinais inibidores (sinais que indicam que o 
padrao € menos provavel). 

O reconhecimento do padrao envia um sinal ativo pelo 
axOnio simulado desse identificador de padroes. Esse 


axOnio, por sua vez, esta conectado a um ou mais 
identificadores de  padroes no- nivel — conceitual 
imediatamente superior. Todos os identificadores de padroes 
conectados no nivel conceitual imediatamente superior 
estao aceitando esse padrao como um de seus /nputs. Cada 
identificador de padroes também envia sinais para baixo, 
para identificadores de padroes de niveis conceituais 
inferiores, sempre que a maior parte de um padrao for 
identificada, indicando que o restante do padrao é 
“esperado”. Cada identificador de padroes tem um ou mais 
desses canais de /nput de sinal esperado. Quando um sinal 
esperado é recebido dessa forma, o limiar de identificacao 
do identificador de padroes é diminuido (facilitado). 

Os identificadores de padroes sao responsaveis por se 
“cabearem” a outros identificadores de padroes, tanto acima 
como abaixo na hierarquia conceitual. Perceba que todos os 
“cabos” numa implementacao por software operam através 
de links virtuais (que, como os links da Internet, sao 
basicamente indicadores de meméoria) e nao cabos fisicos. 
Na verdade, esse sistema é muito mais flexivel do que o do 
cérebro bioldgico. Num cérebro humano, novos padroes 
precisam ser atribuidos a um identificador de padroes fisico, 
e novas conexodes precisam ser feitas com um vinculo real 
entre axdnio e dendrito. Geralmente, isso significa adotar 
uma conexao fisica existente que seja aproximadamente 
aquilo de que se necessita, cultivando depois as extensdes 
necessarias de axénio e dendrito para formar a conexao 
plena. 

Outra técnica usada nos cérebros bioldgicos de 
mamiferos 6 comecar com um grande numero de conexdes 
possiveis, podando depois as conexdes neuraiS que nao 
forem usadas. Se um neocortex bioldgico redesignar 


identificadores corticais de padroes que ja aprenderam 
padroes mais antigos a fim de aprender materiais mais 
recentes, entao as conexoes precisarao ser reconfiguradas 
fisicamente. Mais uma vez, essas tarefas sao muito mais 
simples numa implementacao de software. Simplesmente 
designamos novos locais de memoria para um novo 
identificador de padrées e usamos links de memoria para as 
conexées. Se 0 neocoértex digital deseja redesignar recursos 
de memoria cortical de um conjunto de padrées para outro, 
ele simplesmente devolve os antigos identificadores de 
padroes para a memoria e depois faz a nova designacao. 
Esse tipo de “coleta de lixo” e de redesignacao de memoria 
€ uma caracteristica-padrao da arquitetura de muitos 
sistemas de software. Em nosso cérebro digital, nds também 
fazemos o backup de memorias antigas antes de elimina-las 
do neocortex ativo, uma precaucao que nao podemos ter em 
nossos cérebros bioldgicos. 

Sao muitas as técnicas matematicas que podem ser 
empregadas para implementar essa abordagem a 
identificacao hierarquica e auto-organizada de padroes. O 
método que eu usaria é o dos Modelos Hierarquicos Ocultos 
de Markov, por diversos motivos. Quanto a mim, tenho 
varias décadas de familiaridade com esse método, tendo-o 
usado nos primeiros sistemas de reconhecimento de fala e 
de linguagem natural desde a década de 1980. Quanto ao 
Campo em geral, ha uma experiéncia maior com os Modelos 
Ocultos de Markov do que com qualquer outra abordagem 
para tarefas de identificacao de padrées. Eles também sao 
muito usados na compreensao de linguagem natural. Muitos 
sistemas de compreensao de linguagem natural usam 
técnicas que sao, no minimo, matematicamente similares ao 
HHMM. 


Perceba que nem todos os sistemas de modelos ocultos 
de Markov sao plenamente hierarquicos. Alguns permitem 
apenas uns poucos niveis de hierarquia - indo, por exemplo, 
de estados acusticos para fonemas e destes para palavras. 
Para construir um cérebro, queremos que nosso sistema 
possa criar tantos niveis hierarquicos novos quantos forem 
necessarios. Além disso, muitos dos sistemas de modelos 
ocultos de Markov nao sao plenamente auto-organizados. 
Alguns tém conexoes fixas, embora esses sistemas podem 
efetivamente muitas de suas conexodes _incipientes 
permitindo que desenvolvam conexdoes com peso zero. 
Nossos sistemas das décadas de 1980 e 1990 podavam 
automaticamente conexdes com peso de conexao inferior a 
certo nivel, e também permitiam a formacao de novas 
conexoes para modelar melhor os dados de treinamento e 
para aprender enquanto operavam. Um_ requisito 
importante, creio, @ permitir que o sistema crie com 
flexibilidade suas proprias topologias com base nos padroes 
a que é exposto durante o aprendizado. Podemos usar a 
técnica matematica da programacao linear para designar 
conexoes a novos identificadores de padroes de forma 
otimizada. 

Nosso cérebro digital também vai acomodar uma 
redundancia substancial de cada padrao, especialmente 
aqueles que ocorrem com frequéncia. Isso permite a 
identificagcao robusta de padroes comuns, e também é& um 
dos principais métodos para se conseguir a identificacao 
invariante de diferentes formas de um padrao. Entretanto, 
vamos precisar de regras para saber quanta redundancia 
sera permitida, pois nao queremos usar quantidades 
excessivas de memoria em padroes de baixo nivel muito 
comuns. 


As regras que tratam da redundancia, de limiares de 
identificagcao e do efeito sobre o limiar de uma indicacao 
como “este padrao 6 esperado” sao alguns exemplos de 
parametros gerais importantes que afetam o desempenho 
desse tipo de sistema auto-organizado. Inicialmente, eu 
estabeleceria esses parametros com base em minha 
intuigao, mas depois o otimizaria usando um algoritmo 
genético. 

Um ponto muito importante a se considerar é a educacao 
de um cérebro, seja ele biolégico, seja baseado em software. 
Como disse antes, um sistema hierarquico de identificacao 
de padroées (digital ou biolédgico) vai aprender apenas dois - 
preferivelmente um - niveis hierarquicos de cada vez. Para 
reforcar o sistema, eu comecaria usando redes hierarquicas 
previamente treinadas que ja tivessem aprendido suas licdes 
de identificacao de fala humana, de caracteres impressos e 
de estruturas de linguagem natural. Um sistema assim seria 
capaz de ler documentos em linguagem natural, mas so 
seria capaz de dominar aproximadamente um _ nivel 
conceitual de cada vez. Niveis aprendidos anteriormente 
proporcionariam uma base relativamente estavel para o 
aprendizado do nivel seguinte. O sistema pode ler os 
mesmos documentos repetidas vezes, ganhando novos 
niveis conceituais a cada leitura, tal como as pessoas fazem 
quando releem textos e os compreendem com mais 
profundidade. A Internet tem bilhées de paginas de material 
disponivel. A prdépria Wikipédia tem cerca de 4 milhdées de 
artigos na versao em inglés. 

Eu também incluiria um mddulo de pensamento critico, 
que realizaria uma varredura continua em segundo plano de 
todos os padroes existentes, revisando sua compatibilidade 
com os outros padroes (ideias) nesse neocdértex em software. 


Nao dispomos dessa _ facilidade em nossos_ cérebros 
bioldgicos, motivo pelo qual as pessoas podem ter 
pensamentos completamente inconsistentes com a 
equanimidade. Ao identificar uma ideia inconsistente, o 
modulo digital iniciaria a busca por uma solucao, incluindo 
Suas proprias estruturas corticais e toda a vasta literatura 
disponivel para ela. Uma solucao significaria simplesmente a 
determinacao de que uma das ideias inconsistentes esta 
apenas incorreta (se contraindicada por um predominio de 
dados conflitantes). Em termos mais construtivos, ele 
encontraria uma ideia num nivel conceitual superior que 
solucionaria a aparente contradicao, apresentando uma 
perspectiva que explicasse cada _ ideia. O- sistema 
acrescentaria essa solu¢ao como um novo padrao e um 
vinculo com as ideias que geraram inicialmente a procura 
pela solucao. Esse mddulo de pensamento critico funcionaria 
como uma tarefa continua em segundo plano. Seria muito 
benéfico para oS humanos se nossos cérebros fizessem a 
mesma coisa. 

Eu também incluiria um méddulo que _ identificasse 
questoOes abertas em cada disciplina. Como outra tarefa 
continua em segundo plano, ele procuraria solucdes para 
elas em outras areas dispares de conhecimento. Como disse, 
Oo conhecimento no _ neocdrtex consiste em _ padroes 
profundamente aninhados em padroes, e por isso 4 
totalmente metafdérico. Podemos usar um padrao para 
encontrar uma_ solugao ou i/nsight num campo 
aparentemente desconexo. 

Como exemplo, lembre-se da metafora que usei no 
capitulo 4 sobre os movimentos aleatérios das moléculas de 
um gas e os movimentos aleatdérios da mudan¢ca evolutiva. 
As moléculas de um gas se movem aleatoriamente sem um 


senso de direcao aparente. Apesar disso, praticamente todas 
as moléculas de um gas num béquer, com o tempo, sairao 
do béquer. Comentei que isso abria uma perspectiva sobre 
uma questao importante a respeito da evolucao da 
intelig@ncia. Como as moléculas de um gas, aS mudangas 
evolutivas também se movem em todas as direcdes, sem 
orientagao aparente. Contudo, vemos um movimento na 
direcao de maior complexidade e de maior intelig@éncia, 
rumando efetivamente para a realizagao suprema da 
evolucao: o desenvolvimento de um neocortex capaz de 
pensar hierarquicamente. Assim, conseguimos perceber 
como um processo aparentemente sem propdsito e sem 
direg¢ao pode ter um resultado aparentemente proposital 
num campo (evolucao biolégica) analisando-se outro campo 
(termodinamica). 

Mencionei antes como o /nsight de Charles Lyell (a 
respeito da forma como mudancas minimas em formacdes 
rochosas causadas por filetes de agua puderam escavar 
grandes vales ao longo do tempo) teria inspirado Charles 
Darwin a fazer uma observacao semelhante sobre pequenas 
e minusculas mudancas continuas nas caracteristicas dos 
organismos de uma espécie. Essa procura por metaforas 
seria outro processo continuo em segundo plano. 

Deveriamos apresentar um meio de percorrer diversas 
listas ao mesmo tempo para proporcionar o equivalente a 
um pensamento estruturado. Uma lista poderia ser a 
declaracao das limitagodes que uma solucgao a um problema 
devem satisfazer. Cada etapa pode gerar uma busca 
recursiva pela hierarquia existente de ideias, ou pela 
literatura disponivel. O cérebro humano parece ser capaz de 
lidar com apenas quatro listas simultaneas de cada vez (sem 
a ajuda de ferramentas como os computadores), mas nao ha 


motivo para que um neocortex artificial deva ter tal 
limitacao. 

Também queremos dotar nossos cérebros artificiais com 
uma inteligéncia do tipo em que os computadores sempre 
foram excepcionais, Ou seja, a capacidade de dominar 
imensos bancos de dados com precisao e implementar 
algoritmos conhecidos rapida e eficientemente. O Wolfram 
Alpha combina de forma singular muitos métodos cientificos 
conhecidos e os aplica a dados coletados cuidadosamente. 
Esse tipo de sistema também vai continuar a melhorar, 
tendo em vista o comentario do dr. Wolfram sobre um 
declinio exponencial nos indices de erros. 

Por fim, nosso novo cérebro precisa de um proposito. Um 
proposito se expressa na forma de uma série de metas. No 
caso dos’ cérebros’ biolédgicos, nossas metas’ sao 
estabelecidas pelos centros de prazer e de medo que 
herdamos do cérebro primitivo. Esses impulsos primitivos 
foram estabelecidos inicialmente pela evolucao bioldgica 
para fomentar a sobrevivéncia da espécie, mas o neocortex 
permitiu que nds os sublimassemos. A meta do Watson era 
responder as questdes do /eopardy! Outra meta simples 
poderia ser passar no teste de Turing. Para isso, um cérebro 
digital precisaria da narrativa humana de sua historia ficticia 
para que pudesse fingir ser um ser humano bioldgico. Ele 
também precisaria se fingir de tolo, pois qualquer sistema 
que exibisse os conhecimentos de Watson, digamos, seria 
rapidamente desmascarado como nao bioldgico. 

O mais interessante disso 6 que poderiamos dar ao nosso 
novo cérebro uma meta mais ambiciosa, como contribuir 
para melhorar o mundo. Naturalmente, uma meta dessas 
provocaria uma série de perguntas: melhor para quem? 
Melhor em que sentido? Para os seres humanos bioldégicos? 


Para todos os seres conscientes? Nesse caso, quem ou oO que 
€ consciente? 

Quando os cérebros nao biolégicos se tornarem tao 
Capazes quanto os biolégicos de efetuar mudancas no 
mundo - com efeito, bem mais capazes do que os cérebros 
bioldgicos desassistidos - teremos de pensar em sua 
educagao moral. Um bom lugar para comecar seria uma 
antiga ideia de nossas tradicoes religiosas: a regra de ouro. 


¢ Capitulo 8 « 


A mente como computador 


Com o formato que lembra um pao francés redondo, o cérebro 
humano é um laboratério quimico agitado, repleto de conversas 
neurais incessantes. Imagine o cérebro, esse monticulo reluzente de 
existéncia, esse parlamento celular cinzento como um camundongo, 
essa fabrica de sonhos, esse pequeno tirano dentro de uma bola de 
osso, esse feixe de neurénios que comanda todas as ac6des, esse 
pequeno onipresente, essa caprichosa redoma de prazer, esse 
guarda-roupas enrugado de eus enfiado no cranio, tal como roupas 
em demasia numa sacola de ginastica. 

- Diane Ackerman 


Os cérebros existem porque a distribuicdo de recursos necessarios 
para a sobrevivéncia e os perigos que ameacam a sobrevivéncia 
variam no espaco e no tempo. 

- John M. Allman 


A moderna geografia do cérebro tem um ar deliciosamente 
antiquado - como um mapa medieval onde se vé o mundo 
conhecido rodeado por terra incognita, onde monstros vagueiam. 

- David Bainbridge 


Na matematica, vocé nao compreende coisas. Vocé simplesmente se 
acostuma com elas. 
- John von Neumann 


esde o surgimento do computador em meados do século 20, 

tem havido uma discussao continua nao apenas sobre 

o limite final de sua capacidade, como a respeito de 

podermos considerar 0 proprio cérebro humano um tipo 
de computador. No que diz respeito a essa ultima questao, o 
consenso mudou; antes se viam essas duas espécies de 
entidades de processamento de_ informacoes como 
essencialmente a mesma coisa, e@ agora elaS sao 
consideradas fundamentalmente diferentes. E entao, o 
cérebro € um computador? 

Quando os computadores comecaram a se popularizar na 
década de 1940, foram considerados imediatamente 
maquinas de pensar. O ENIAC, que foi anunciado em 1946, 
foi descrito na imprensa como um “cérebro gigante”. 
Quando os computadores se tornaram comercialmente 
disponiveis na década seguinte, os anuncios se referiam 
rotineiramente a eles como cérebros capazes de feitos que 
os cérebros biol6gicos comuns nao conseguiam realizar. 

Rapidamente, os programas de computador permitiram 
que as maquinas correspondessem a essa expectativa. O 
“solucionador geral de problemas”, criado em 1959 por 
Herbert A. Simon, J. C. Shaw e Allen Newell na Carnegie 
Mellon University, conseguiu idealizar uma prova para um 
teorema que os matematicos Bertrand Russell (1872-1970) e 
Alfred North Whitehead (1861-1947) nao tinham conseguido 
resolver em sua famosa obra de 1913, Principia 
Mathematica. O que ficou aparente nas décadas seguintes 
foi que os computadores podiam exceder, rapida e 
significativamente, a capacidade humana desassistida em 
exercicios intelectuais como a solucao de_ problemas 
matematicos, 0 diagndstico de doencas e o jogo de xadrez, 
mas tinham dificuldade para controlar um robo tentando dar 


o lago num cordao de sapatos ou compreender a linguagem 
comum, algo que uma criangca de 5 anos conseguia 
entender. Somente agora, os computadores’ estao 
comecando a dominar esse tipo de habilidade. Ironicamente, 
a evolucao da inteligéncia dos computadores dirigiu-se no 
sentido oposto ao da maturacao humana. 
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Propaganda de 1957 mostrando a concepcao popular do computador como um 
cérebro gigante 


Até hoje, é controvertida a questao sobre se o 
computador e o cérebro humano se equivaleriam em algum 
nivel. Na introducao, mencionei que havia milhdes de links 
para citagcdes sobre a complexidade do cérebro humano. De 
modo analogo, uma pesquisa no Google sobre “Citacdes: o 
cérebro nao € um computador” também produz milhdes de 
links. Na minha opiniao, frases nesse sentido sao 


semelhantes a dizer que “Compota de maca nao € maca”. 
Tecnicamente, essa declaracao é verdadeira, mas vocé pode 
fazer compota de macga com uma maca. Seria mais objetivo 
dizer algo como: “Computadores nao sao processadores de 
texto”. E verdade que um computador e um processador de 
texto existem em niveis conceituais diferentes, mas um 
computador pode se tornar um processador de texto se tiver 
um programa de processamento de texto sendo executado, 
e€ nao o contrario. Do mesmo modo, um computador pode se 
tornar um cérebro se tiver um software cerebral sendo 
executado. E isso que pesquisadores, inclusive eu, estao 
tentando fazer. 

Portanto, a questao 6 saber se podemos ou nao descobrir 
um algoritmo que _ transforme um computador numa 
entidade equivalente a um cérebro humano. Afinal, um 
computador pode executar qualquer algoritmo que 
possamos definir, por causa de sua universalidade inata 
(Sujeita apenas a sua Capacidade). O cérebro humano, por 
outro lado, executa um conjunto especifico de algoritmos. 
Seus métodos sao inteligentes, pois ele da espaco para uma 
plasticidade significativa e para a reestruturacao de suas 
proprias conexdes com base em sua experiéncia, mas essas 
funcgoes podem ser emuladas por software. 

A universalidade da computacao (o conceito de que um 
computador de_ propdsitos gerais pode implementar 
qualquer algoritmo) - e o poder dessa ideia - surgiu junto 
com as primeiras maquinas fisicas. Ha quatro conceitos 
vitais por tras da universalidade e da viabilidade da 
computacao e sua aplicabilidade a nosso modo de pensar. 
Vale a pena revisa-los aqui, pois 0 préprio cérebro os utiliza. 
O primeiro @€ a capacidade de comunicar, lembrar e 
computar informacgdes de maneira confiavel. Por volta de 


1940, se vocé usasse a palavra “computador”, aS pessoas 
presumiriam que vocé estivesse falando de um computador 
analégico, no qual oS numeros eram representados por 
niveis diferentes de voltagem, e@ componentes 
especializados podiam executar funcdes especificas como 
soma e multiplicacao. Entretanto, uma grande limitacgao dos 
computadores analdgicos é que eles eram atormentados por 
problemas de precisao. Os numeros sO podiam_ ser 
representados com precisao de um centésimo, e como o 
nivel da voltagem que os representava era processado por 
um numero cada vez maior de operadores aritméticos, os 
erros eram cumulativos. Se vocé quisesse realizar mais do 
que um punhado de operacoées, os resultados seriam tao 
imprecisos que nao teriam sentido nenhum. 

Quem se recorda da época em que se gravava musica em 
gravadores analdgicos de fita vai se lembrar desse efeito. 
Havia uma degradacao sensivel na primeira copia, que 
ficava com uM pouco mais de ruido do que a fita original. 
(Lembre-se de que o “ruido” representa imprecisao 
aleatoéria.) A cépia da cépia tinha mais ruido ainda, e por 
volta da décima geracao, a copia era quase que so ruido. 
Presumia-se que 0 mesmo problema atormentaria 0 mundo 
emergente dos computadores digitais. Podemos entender 
essa preocupagao se considerarmos a comunicagao de 
informacoes digitais por um canal. Nenhum canal é perfeito 
e cada um tera um nivel intrinseco de erro. Suponha que 
temos um canal com uma probabilidade de 0,9 de transmitir 
corretamente cada bit. Se eu enviar uma mensagem com um 
bit, a probabilidade de esta ser transmitida corretamente 
sera 0,9. E se eu enviar dois bits? Agora, a precisao é de 
0,92 = 0,81. E se eu enviar um byte (oito bits)? Terei menos 
do que 50% (0,43, para ser preciso) de chance de envia-lo 


corretamente. A probabilidade de enviar com precisao cinco 
bytes 6 de 1%, aproximadamente. 

Uma solucao Obvia para impedir esse problema é tornar o 
canal mais preciso. Suponha que o canal comete apenas um 
erro a cada milhao de bits. Se eu enviar um arquivo formado 
por meio milhao de bytes (mais ou menos do tamanho de 
um programa ou banco de dados modesto), a probabilidade 
de transmiti-lo corretamente 6 de menos do que 2%, apesar 
de a precisao inerente do canal ser bastante elevada. Tendo 
em vista que um erro de um Unico bit pode invalidar 
completamente um programa de computador e outras 
formas de dados digitais, essa solucao nao é Satisfatoria. 
Nao importa qual seja a precisao do canal, como a 
probabilidade de um erro numa transmissao aumenta 
rapidamente com o tamanho da mensagem, essa barreira 
pareceria intransponivel. 

Computadores analdgicos lidaram com esse problema 
através da degradacao graciosa (o que significa que os 
usuarios SO apresentavam problemas nos quais podiam 
tolerar pequenos erros); porém, se os usuarios de 
computadores analdgicos se limitassem a um conjunto 
restrito de calculos, os computadores se mostravam 
razoavelmente uteis. Computadores digitais, por outro lado, 
exigem comunicacao continua, nao sé de um computador 
para outro, como dentro do computador em si. Existe 
comunicacao entre sua memoria e a unidade central de 
processamento. Dentro da unidade — central de 
processamento, ha comunicacao entre um registro e outro, e 
de um lado para outro da unidade aritmética, e assim por 
diante. Mesmo dentro da _unidade_ aritmética, ha 
comunicagao entre o registro de um bit e outro. A 
comunicacao permeia todos os niveis. Se lembrarmos que o 


indice de erro aumenta rapidamente com o aumento da 
comunicacao e que um erro de um Unico bit pode destruir a 
integridade de um processo, a computacao digital estava 
fadada ao fracasso - pelo menos, era 0 que se pensava na 
epoca. 

Essa era a opiniao geral até o matematico norte- 
americano Claude Shannon (1916-2001) aparecer e 
demonstrar como podemos criar comunicagoes 
arbitrariamente precisaS usando até os canais de 
comunicagao menos confiaveis. O que Shannon disse em 
seu trabalho monumental, “A Mathematical Theory of 
Communication”, publicado no Bell System Technical Journal 
em julho e outubro de 1948, e em particular em seu teorema 
de codificacao de canais ruidosos, era que se tivéssemos um 
canal com qualquer indice de erros (exceto um canal com 
exatamente 50% por bit, o que significaria que o canal 
estaria transmitindo ruido puro), seriamos capazes de 
transmitir uma mensagem na qual o indice de erro seria tao 
preciso quanto quiséssemos. Noutras palavras, o indice de 
erros da transmissao poderia ser de um bit em rn bits, sendo 
que n pode ter o tamanho que definirmos. Assim, por 
exemplo, num extremo, se tivermos um canal que transmite 
corretamente bits de informacgao apenas em 51% do tempo 
(ou seja, ele transmite um bit correto um pouco mais 
frequentemente do que um bit errado), mesmo assim 
poderemos transmitir mensagens de modo que apenas um 
bit num milhao estara incorreto, ou um bit num trilhao ou 
num trilhao de trilhdes. 

Como isso é possivel? Pela redundancia. Hoje talvez isso 
pareca Obvio, mas na época nao era assim. Como exemplo 
simples, se eu transmitir trés vezes cada bit e tiver a maioria 
dos  votos, terei aumentado’- substancialmente a 


confiabilidade do resultado. Se isso nao for suficiente, basta 
aumentar a redundancia até obter a confiabilidade de que 
precisa. A mera repeticao da informacao é a forma mais facil 
de obter elevados indices de precisao com canais de baixa 
precisao, Mas nao é a abordagem mais eficiente. O trabalho 
de Shannon, que estabeleceu o campo da teoria da 
informacao, apresentou métodos ideais de deteccao de erros 
e cédigos de correcao que podem atingir qua/quer precisao 
desejada através de gua/quer canal nao aleat6ério. 

Os leitores mais velhos vao se lembrar do modem 
telefénico, que transmitia informac6es através de ruidosas 
linhas telefénicas analdgicas. Essas linhas apresentavam 
ruidos e chiados dbvios, bem como outras formas de 
distor¢ao, mas mesmo assim eram capazes de transmitir 
dados digitais com indices de precisao bastante elevados, 
gracgas ao teorema do canal ruidoso de Shannon. O mesmo 
problema e a mesma solucao existem para a memo6oria 
digital. Nunca se perguntou como CDs, DVDs e discos de 
programas continuam a apresentar resultados confiaveis 
mesmo depois que o disco caiu no chao e se arranhou? Mais 
uma vez, devemos agradecer a Shannon. 

A computacao consiste em trés elementos: comunicacao 
- que, como mencionei, esta sempre presente dentro de 
computadores e entre eles -, memoria e portas Idégicas (que 
realizam as funcdes aritméticas e légicas). A precisao das 
portas lédgicas também pode ser arbitrariamente elevada 
usando-se, do mesmo modo, deteccao de erros e cdédigos de 
correcao. Gracas ao teorema e a teoria de Shannon, 
podemos lidar com  dados e = algoritmos_ digitais 
arbitrariamente grandes e complexos sem que os processos 
sejam perturbados ou destrufdos por erros. E importante 
destacar que o cérebro também usa o principio de Shannon, 


embora a evolucgao do cérebro humano seja claramente 
anterior a do prdprio Shannon! A maioria dos padr6ées ou 
ideias (e uma ideia também é um padrao), como vimos, esta 
armazenada no cérebro com uma quantidade substancial de 
redundancia. Uma razao primaria para a redundancia no 
cérebro é a inconfiabilidade intrinseca dos circuitos neurais. 

A segunda ideia importante na qual a era da informacao 
se baseia € uma que ja mencionei: a universalidade da 
computacao. Em 1936, Alan Turing descreveu sua “maquina 
de Turing”, que nao era uma maquina de verdade, mas outro 
experimento mental. Seu computador tedrico consiste numa 
fita de memoria infinitamente longa com um 1 ou 0 em cada 
quadrado. O input da maquina € apresentado por essa fita, 
que a maquina consegue ler a razao de um quadrado por 
vez. A maquina também contém uma tabela de regras - 
essencialmente um programa armazenado - que consiste 
em estados numerados. Cada regra especifica uma acao se oO 
quadrado sendo lido for um 0, € uma acao diferente se o 
quadrado atual for um 1. As acodes possiveis incluem 
escrever 0 ou 1 na fita, mover a fita um quadrado para a 
direita OU para a esquerda, ou parar. Cada estado vai 
especificar o numero do préximo estado em que a maquina 
deveria estar. 

O input da maquina de Turing é apresentado na fita. O 
programa roda e, quando a maquina para, o algoritmo foi 
concluido e o output-processo fica na fita. Perceba que, 
apesar de a fita ter, teoricamente, um comprimento infinito, 
qualquer programa que nao entre num laco infinito vai usar 
apenas uma parte finita da fita; logo, se nos limitarmos a 
uma fita finita, a maquina ainda vai resolver um conjunto 
util de problemas. 


Se a Maquina de Turing parece simples € porque foi esse 
oO objetivo de seu inventor. Turing queria que a maquina 
fosse o mais simples possivel (mas nao mais simples, 
parafraseando Einstein). Turing e Alonzo Church (1903- 
1995), seu antigo professor, desenvolveram a tese Church- 
Turing, que afirma que, se um problema que pode ser 
apresentado a uma maquina de Turing nao pode ser 
resolvido por ela, ele também nao pode ser resolvido por 
maquina nenhuma, em decorréncia da lei natural. Apesar de 
a maquina de Turing ter apenas um punhado de comandos e 
processar apenas um bit de cada vez, ela pode calcular 
qualquer coisa que qualquer computador possa calcular. 
Outra forma de dizer isso 6 que qualquer maquina que seja 
“Turing completa” (ou seja, que tenha capacidades 
equivalentes a uma maquina de Turing) pode computar 
qualquer algoritmo (qualquer procedimento que possamos 
definir). 


Diagrama da transicao de estados 
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Diagrama em blocos de uma maquina de Turing com um cabecote que lée 
escreve na fita e um programa interno que consiste em transicdes de estados 


Interpretacoes “fortes” da tese Church-Turing propoem 
uma equivaléncia essencial entre 0 que um humano pode 
pensar ou Saber, e 0 que é computavel por uma maquina. A 
ideia basica 6 que o cérebro humano esta, do mesmo modo, 
sujeito a lei natural, e@ assim Sua capacidade de 
processamento de informacdoes nao pode exceder a de uma 
maquina (e, portanto, a de uma maquina de Turing). 

Podemos dar os créditos apropriados a Turing por ter 
estabelecido a base tedrica da computacao com seu 
trabalho de 1936, mas é importante observar que ele foi 
profundamente influenciado por uma palestra apresentada 
pelo matematico hungaro-americano John von Neumann 
(1903-1957) em Cambridge, em 1935, sobre seu conceito de 
programa armazenado, um conceito que foi incorporado a 
maquina de Turing [1]. Por sua vez, von Neumann foi 
influenciado pelo trabalho de Turing de 1936, que 
estabeleceu de forma elegante os principios da computacao, 
e tornou-o leitura obrigatéria para seus colegas no final da 
década de 1930 e inicio da seguinte [2]. 

No mesmo trabalho, Turing relata outra descoberta 
inesperada: a dos problemas insoluveis. Sao problemas bem 
definidos e com respostas Unicas que se pode mostrar que 
existem, mas que também podemos provar que nunca 
podem ser computados por uma maquina de Turing - ou 
seja, por nenhuma maquina, oO inverso de um dogma do 
século 19 que afirmava que problemas que podiam ser 
definidos poderiam, em ultima analise, ser resolvidos. Turing 
mostrou que ha tantos problemas insoluveis quanto 
soluveis. O matematico e fildsofo austro-americano Kurt 
Godel chegou a uma conclusao similar em seu “teorema da 
incompletude”, de 1931. Assim, ficamos com a 
surpreendente situag¢ao na qual podemos definir um 








problema, provar que existe uma resposta Unica, e saber 
que a resposta nunca pode ser encontrada. 

Turing mostrara que, em sua esséncia, a computacao se 
baseia num mecanismo muito simples. Como a maquina de 
Turing (e portanto qualquer computador) 6 capaz de basear 
seu futuro curso de acao nos resultados que ja calculou, ela 
€ capaz de tomar decisOes e de modelar hierarquias 
arbitrariamente complexas de informacao. 

Em 1939, Turing projetou uma calculadora eletrénica 
chamada Bombe que ajudou a decodificar mensagens que 
tinham sido criptografadas pela maquina de codificacao 
nazista Enigma. Em 1943, uma equipe de engenheiros 
influenciada por Turing concluiu a constru¢ao daquele que 
foi provavelmente o primeiro computador, o Colossus, que 
permitiu aos aliados continuarem a decodificar mensagens 
das versoes mais sofisticadas da Enigma. Bombe e Colossus 
foram projetados para uma Unica tarefa e nao podiam ser 
reprogramados para outra. Mas realizaram brilhantemente 
suas tarefas e receberam o crédito por terem permitido aos 
Aliados vencer a vantagem de trés da Luftwaffe alema sobre 
a Royal Air Force britanica, e a vencer a crucial Batalha da 
Inglaterra, bem como a continuar a antever as taticas 
nazistas ao longo da guerra. 

Foi com base nisso que John von Neumann criou a 
arquitetura do computador moderno, que representa nossa 
terceira ideia importante. Chamada de maquina de von 
Neumann, tem sido a estrutura central de praticamente 
todos oS computadores dos ultimos 67 anos, desde o 
microcontrolador em sua maquina de lavar até os maiores 
supercomputadores. Num trabalho datado de 30 de junho 
de 1945 e intitulado “Primeiro Esboco de um Relatério sobre 
o EDVAC”, von Neumann apresentou as ideias que tém 


dominado a computacao desde entao [3]. O modelo de von 
Neumann inclui uma unidade central de processamento, na 
qual sao realizadas as operacoes aritméticas e ldgicas; uma 
unidade de memoria, na qual sao armazenados programas e 
dados; armazenagem em grande escala; um contador de 
programas; e canais de /nput e de output. Embora esse 
trabalho fosse apenas um documento de um projeto interno, 
tornou-se a biblia dos projetistas de computadores. Vocé 
nunca sabe quando um memorando interno, aparentemente 
rotineiro, vai acabar revolucionando o mundo. 

A maquina de Turing nao foi projetada para ser pratica. 
Os teoremas de Turing nao se preocupavam com a eficiéncia 
na solugao de problemas, mas com o exame da gama de 
problemas que, teoricamente, poderiam ser resolvidos pela 
computacao. A meta de von Neumann, por outro lado, era 
criar um conceito viavel de maquina computacional. Seu 
modelo substitui os calculos de um bit de Turing por 
palavras com multiplos bits (geralmente, algum multiplo de 
oito bits). A fita de memoria de Turing € sequencial, e por 
isSO OS programas de maquinas de Turing passam um tempo 
enorme movendo a fita para a frente e para tras para 
armazenar e recuperar resultados intermediarios. Em 
contraste, a meméodria de von Neumann é de _ acesso 
aleatério, e€ por isso qualquer dado pode ser resgatado 
imediatamente. 

Uma das principais ideias de von Neumann é 0 programa 
armazenado, que ele introduzira uma década antes: colocar 
O programa no mesmo tipo de memoria de acesso aleatério 
que os dados (e geralmente no mesmo bloco de memoéoria). 
Isso permitia ao computador ser reprogramado para diversas 
tarefas, bem como para a automodificacao dos cdédigos (se o 
local de armazenamento do programa for gravavel), o que 


permite uma forma poderosa de recursividade. Até entao, 
praticamente todos os computadores, inclusive o Colossus, 
tinham sido construidos para uma tarefa especifica. O 
programa armazenado permitia que um computador fosse 
realmente universal, satisfazendo assim a visao de Turing 
sobre a universalidade da computacao. 

Outro aspecto importante da maquina de von Neumann é 
que cada instrucgao inclui um cddigo de _ operacao 
especificando a operacao aritmética ou Idédgica que sera 
realizada e o endereco de um operando da memoria. 

O conceito de von Neumann sobre 0 modo como um 
computador deveria ser arquitetado foi apresentado com 
Sua publicagao do desenho do EDVAC, um projeto que ele 
realizou com os colaboradores J. Presper Eckert e John 
Mauchly. O EDVAC em si funcionou somente em 1951, época 
na qual ja havia outros computadores com programas 
armazenados, como o Manchester Small-Scale Experimental 
Machine, o ENIAC, 0 EDSAC e o BINAC, todos influenciados 
profundamente pelo trabalho de von Neumann, e 
envolvendo Eckert e Mauchly como. projetistas. Von 
Neumann contribuiu diretamente para o desenho de 
diversas dessas maquinas, inclusive uma versao posterior do 
ENIAC, que suportava um programa armazenado. 

Houve alguns precursores da arquitetura de von 
Neumann, embora, com uma _ surpreendente excecao, 
nenhuma delas seja uma verdadeira maquina de von 
Neumann. Em 1944, Howard Aiken apresentou o Mark I, que 
tinha um elemento de programabilidade, mas nao usava um 
programa armazenado. Ele lia instrugcoes de uma fita 
perfurada de papel e executava cada comando 
imediatamente. Ele também nao tinha uma instrucao de 
desvio condicional. 


Em 1941, o cientista alemao Konrad Zuse (1910-1995) 
criou 0 computador Z-3. Ele também lia seu programa numa 
fita (neste caso, codificada em filme) e também nao tinha 
instrucao de desvio condicional. E interessante observar que 
Zuse obteve apoio do German Aircraft Research Institute 
(Instituto de Pesquisa Aeronautica da Alemanha), que usou o 
aparelho para estudar a vibracao de asas, mas seu pedido ao 
governo nazista de verbas para substituir os relés por 
valvulas foi recusado. Os nazistas consideravam que a 
computacao “nao tem importancia para a guerra”. Essa 
perspectiva ajuda muito, em minha opiniao, a explicar o 
resultado da guerra. 

Na verdade, ha um precursor auténtico do conceito de 
von Neumann, e ele surgiu um século antes! A chamada 
Maquina Analitica do matematico e inventor inglés Charles 
Babbage (1791-1871), descrita por ele em _ 1837, 
incorporava as ideias de von Neumann e apresentava um 
programa armazenado através de cart6des_ perfurados, 
tomados por empréstimo do tear de Jacquard [4]. Sua 
memoria de acesso aleatério incluia mil palavras com 50 
digitos decimais cada uma (o equivalente a 21 kilobytes 
aproximadamente). Cada instrugao inclufa um _ céddigo 
operacional e um numero operando, tal como as modernas 
linguagens de maquina. Ela incluia desvio condicional e 
looping, € por isso era uma verdadeira maquina de von 
Neumann. Baseava-se_ inteiramente em  engrenagens 
mecanicas e, ao que parece, a Maquina Analitica estava 
além da capacidade de projeto e organizacao de Babbage. 
Ele construiu partes dela, mas nunca a ligou. Nao se sabe ao 
certo se os pioneiros da computacao do século 20, inclusive 
von Neumann, conheciam o trabalho de Babbage. 


O computador de Babbage resultou na criagao do campo 
da programacao de softwares. A escritora inglesa Ada Byron 
(1815-1852), condessa de Lovelace e Unica filha legitima de 
lorde Byron, o poeta, foi a primeira programadora de 
computadores do mundo. Ela escreveu programas para a 
Maquina Analitica, que ela precisava depurar em sua propria 
mente (uma vez que o computador nunca chegou a 
funcionar), uma pratica bem conhecida dos engenheiros de 
software da atualidade como “tabela de checagem”. Ela 
traduziu um artigo do matematico italiano Luigi Menabrea 
sobre a Maquina Analitica e acrescentou suas prdprias 
anotacdes, escrevendo que “a Maquina Analitica tece 
padroes algébricos, assim como o tear de Jacquard tece 
flores e folhas”. Ela apresentou depois aquelas que podem 
ter sido as primeiras especulagoes sobre a viabilidade da 
inteligéncia artificial, mas concluiu que a Maquina Analitica 
“nao tem pretensao alguma de originar 0 que quer que 
seja”. 

O conceito de Babbage é& bem milagroso se vocé pensar 
na era em que ele viveu e trabalhou. No entanto, em 
meados do século 20, suas ideias tinham sido perdidas nas 
brumas do tempo (embora tenham sido redescobertas 
subsequentemente). Foi von Neumann quem conceituou e 
articulou os principios basicos do computador tal como o 
conhecemos hoje, e 0 mundo reconhece isso continuando a 
se referir a maquina de von Neumann como o principal 
modelo de computacao. Lembre-se, porém, de que a 
maquina de von Neumann comunica continuamente dados 
entre suas diversas unidades e dentro dessas unidades, e 
por issO nao poderia ser construida sem os teoremas de 
Shannon e os métodos que ele idealizou para transmitir e 
armazenar informacoes digitais confiaveis. 


Isso nos leva a quarta ideia importante, que é ir além da 
conclusao de Ada Byron de que um computador nao pode 
pensar criativamente e encontrar os principais algoritmos 
empregados pelo cérebro, usando-os para transformar um 
computador num cérebro. Alan Turing apresentou essa meta 
em seu trabalho de 1950, “Computing Machinery and 
Intelligence”, que inclui o hoje famoso teste de Turing para 
averiguar se uma IA atingiu um nivel humano de 
intelig@ncia. 

Em 1956, von Neumann comecou a preparar uma série 
de palestras destinadas a prestigiosa série Silliman de 
palestras na Universidade de Yale. Devido ao cancer, ele 
nunca apresentou essas_ palestras, nem concluiu’ o 
manuscrito a partir do qual elas seriam compiladas. Esse 
documento inacabado é, até hoje, uma brilhante e profética 
antecipagao daquele que considero o mais assombroso e 
importante projeto da humanidade. Foi publicado 
postumamente como O computador e o cérebro [The 
Computer and the Brain], em 1958. E coerente ver que a 
obra final de um dos mais brilhantes matematicos do século 
passado e um dos pioneiros da era dos computadores tenha 
sido um exame da propria inteligéncia. Esse projeto foi a 
primeira investigacao séria do cérebro humano segundo a 
perspectiva de um matematico e cientista da computacao. 
Antes de von Neumann, oS campos da ci@ncia da 
computacao e da neurociéncia eram duas ilhas sem uma 
ponte entre elas. 

Von Neumann comegca sua discussao apresentando as 
semelhancas e as diferencas entre 0 computador e o cérebro 
humano. Tendo em conta a época em que redigiu esse 
manuscrito, ele 6 notavelmente preciso. Ele comentou que o 
output dos neurdnios era digital: um ax6nio disparava ou 


nao. Isso estava longe de ser 6bvio naquele tempo, pois se 
achava que o output poderia ser um sinal analdgico. O 
processamento nos dendritos que se ligam a neurdnios, e no 
corpo celular do neurénio somatico, porém, era analdgico, e 
ele descreveu seus calculos como uma soma ponderada de 
inputs com um limiar. Este modelo do funcionamento dos 
neurdénios levou ao campo do conexionismo, que construiu 
sistemas baseados nesse modelo do neurdnio, tanto no 
hardware como no software. (Como descrevi no capitulo 
anterior, O primeiro desses sistemas conexionistas foi criado 
por Frank Rosenblatt como programador de software num 
computador IBM 704 em Cornell em 1957, logo apds os 
esbocos de palestra de von Neumann serem divulgados.) 
Hoje, temos modelos mais sofisticados da maneira como os 
neur6énios combinam inputs, mas a ideia essencial do 
processamento analdgico dos inputs dos dendritos usando 
concentracgdoes de neurotransmissores permaneceu valida. 
Von Neumann aplicou o conceito da universalidade da 
computacao para concluir que, apesar de a arquitetura e os 
tijolos parecerem radicalmente diferentes entre cérebro e 
computador, podemos concluir, ainda assim, que uma 
maquina de von Neumann pode simular o processamento 
num cérebro. O contrario nao se aplica, porém, uma vez que 
o cérebro nao € uma maquina de von Neumann e nao possui 
um programa armazenado (embora possamos simular uma 
maquina de Turing bem simples em nossas cabecas). Seu 
algoritmo ou seus métodos estao implicitos em sua 
estrutura. Von Neumann conclui corretamente que os 
neurénios podem aprender padréoes com seus inputs, o que 
ja determinamos que esta codificado em parte na forca dos 
dendritos. O que nao se sabia na época de von Neumann é 


que o aprendizado também tem lugar através da criagao e 
da destruicao de conexées entre neurénios. 

Von Neumann comenta, com _ presciéncia, que a 
velocidade do processamento neural é extremamente baixa, 
da ordem de uma centena de calculos por segundo, mas que 
o cérebro compensa isso através de um processamento 
paralelo macico - outro insight nada dbvio e crucial. Von 
Neumann disse que cada um dos 1010 neur6énios do cérebro 
(um numero razoavelmente preciso; as estimativas atuais 
ficam entre 1010 e 1011) estaria processando ao mesmo 
tempo. Com efeito, cada uma das conexées (com uma média 
entre 103 e 104 conexoes por neurénio) esta computando 
simultaneamente. 

As estimativas de von Neumann e sua descrigao do 
processamento neural sao notaveis, tendo em vista o estado 
primitivo da neurociéncia nessa época. Um aspecto de sua 
obra do qual discordo, porém, 6 sua avaliacao da capacidade 
de memoria do cérebro. Ele presume que o cérebro se 
recorda de todos os /nputs durante toda a sua vida. Von 
Neumann supde uma vida média de 60 anos, ou cerca de 2 
x 109 segundos. Com cerca de 14 inputs por neurénio por 
segundo (o que na verdade é baixo, pelo menos com trés 
ordens de grandeza) e com 10?° neurdnios, ele chega a uma 
estimativa de cerca de 1029 bits para a capacidade de 
memoria do cérebro. A realidade, como comentei antes, é 
que nos lembramos apenas de uma pequena fracao de 
nossos pensamentos e experiéncias, e@ mesmo essas 
memorias nao estao armazenadas como padroes de bits 
num nivel inferior (como uma imagem em video), mas como 
sequéncias de padroes de nivel superior. 


Quando von Neumann descreve cada mecanismo do 
cérebro, ele mostra como um computador moderno poderia 
realizar a mesma coisa, apesar de diferencas aparentes. Os 
mecanismos analdgicos do cérebro podem ser simulados 
através de mecanismos digitais, pois a computacao digital 
pode emular valores analdgicos em qualquer grau desejado 
de precisao (e€ a precisao da informacao analdgica no 
cérebro € bem baixa). O paralelismo macico do cérebro 
também pode ser simulado, tendo em vista a significativa 
vantagem de velocidade dos computadores na computacao 
serial (uma vantagem que aumentou muito ao longo do 
tempo). Além disso, também podemos usar o processamento 
paralelo em computadores usando maquinas de von 
Neumann em paralelo - que é exatamente a forma como os 
supercomputadores trabalham hoje. 

Von Neumann conclui que os métodos do cérebro nao 
podem envolver algoritmos sequenciais extensos, se 
levarmos em conta a velocidade com que os humanos 
conseguem tomar decisOes em combinagcao com a 
velocidade computacional muito lenta dos neurénios. 
Quando um jogador da terceira base pega a bola no are 
decide lanca-la para a primeira base e nao para a segunda, 
ele toma essa decisao numa fragao de segundo, tempo 
apenas suficiente para que cada neurénio passe por um 
punhado de ciclos. Von Neumann conclui corretamente que 
os notaveis poderes do cérebro provém do fato de que seus 
100 bilhdes de  neurénios conseguem _ processar 
simultaneamente as informacdes. Como ja disse, o cdrtex 
visual faz sofisticados julgamentos visuais em apenas trés 
ou quatro ciclos neurais. 

Ha uma plasticidade consideravel no cérebro, o que nos 
permite aprender. Mas ha bem mais plasticidade num 


computador, que pode reestruturar completamente seus 
métodos mudando seu software. Logo, nesse sentido, um 
computador sera capaz de imitar o cérebro, mas o inverso 
nao se aplica. 

Quando von Neumann comparou a capacidade da imensa 
organizagao paralela do cérebro com _ os_ (poucos) 
computadores de sua €poca, ficou claro que o cérebro tinha 
bem mais memoria e velocidade. Mas, hoje, o primeiro 
supercomputador a atingir especificagcoes que equivalem a 
algumas das estimativas mais conservadoras da velocidade 
necessaria para simular o cérebro humano em _ termos 
funcionais (cerca de 101° operacées por segundo) ja foi 
construido [5]. (Estimo que esse nivel de computacao 
custara US$ 1 mil no inicio da década de 2020.) Com relacao 
a memoria, estamos até mais proéximos. Apesar de ter escrito 
seu trabalho num momento notavelmente precoce da 
histéria do computador, von Neumann acreditava que tanto 
o hardware como o software da_ inteligéncia Numana 
acabariam se ajustando, o que foi a sua motivacao para 
preparar essas palestras. 

Von Neumann’ estava_ profundamente ciente da 
aceleragcao do ritmo do progresso e de suas profundas 
implicacées para o futuro da humanidade. Um ano apés sua 
morte em 1957, 0 colega matematico Stan Ulam mencionou 
uma frase dele do inicio da década de 1950, na qual dizia 
que “o progresso cada vez mais acelerado da tecnologia e 
das mudancas no modo de vida humana dao a aparéncia de 
que estamos nos aproximando de uma _ singularidade 
essencial na histéria da ragca além da qual os assuntos 
humanos, tal como os conhecemos, nao _ poderiam 
continuar”. Esse foi o primeiro uso conhecido da palavra 


“singularidade” no contexto da histéria tecnolégica do 
homem. 

O insight fundamental de von Neumann foi que havia 
uma equivaléncia essencial entre um computador e o 
cérebro. Perceba que a intelig€ncia emocional de um ser 
humano biolégico é parte de sua inteligéncia. Se o insight 
de von Neumann estiver correto, e se aceitarem minha 
declaragao de f€é em que uma entidade nao biolégica que 
torna a criar de forma convincente a inteligéncia (emocional 
e outras) de um humano bioldgico tem consciéncia (veja o 
proximo capitulo), entao teremos de concluir que existe uma 
equivaléncia essencial entre um computador - com o 
software correto - e uma mente (consciente). Desse modo, 
sera que von Neumann esta certo? 

A maioria dos computadores de hoje é€ inteiramente 
digital, enquanto o cérebro humano combina métodos 
digitais e analégicos. Mas os métodos analdgicos sao facil e 
rotineiramente recriados pelos digitais, com qualquer nivel 
desejado de precisao. O cientista norte-americano da 
computacao Carver Mead (nascido em 1934) mostrou que 
podemos emular diretamente os métodos analdgicos do 
cérebro com o silfcio, que ele demonstrou com o que chama 
de chips “neuromérficos [6]”. Mead demonstrou como essa 
abordagem pode ser milhares de vezes mais eficiente do 
que a emulacao digital de métodos analdgicos. Ao 
codificarmos o algoritmo neocortical macicamente repetido, 
fara sentido usar a abordagem de Mead. O IBM Cognitive 
Computing Group, comandado por Dharmendra Modha, 
introduziu chips que emulam neur6énios e suas conexées, 
inclusive a capacidade de formar novas conexoes [7]. 
Chamado “SyNAPSE”, um dos chips proporciona uma 
simulacao direta de 256 neurdénios com cerca de 250 mil 


conex6ées sinapticas. A meta do projeto é criar um neocortex 
simulado com 10 bilhdes de neurdnios e 100 trilhédes de 
conexées - 0 que se aproxima de um cérebro humano - que 
consome apenas um quilowatt de energia. 

Como von Neumann descreveu ha mais de meio século, o 
cérebro é€ extremamente lento, mas macicamente paralelo. 
Os circuitos digitais atuais sao, no minimo, 10 milhdes de 
vezes mais rapidos do que os comutadores eletroquimicos 
do cérebro. Por outro lado, os 300 milhdes de identificadores 
neocorticais de padroes processam simultaneamente, e seu 
quatrilhao de conexoes interneuronais tem o potencial para 
computar ao mesmo tempo. O ponto principal para se obter 
o hardware necessario para modelar com sucesso um 
cérebro humano, porém, sao a memoria global e a taxa de 
transferéncia computacional necessarias. Nao precisamos 
copiar diretamente a arquitetura do cérebro, 0 que seria 
uma abordagem muito ineficiente e inflexivel. 

Vamos estimar quaiS sao os requisitos de hardware. 
Muitos projetos tentaram emular o aprendizado hierarquico 
e a identificagao de padroes que acontecem na hierarquia 
neocortical, inclusive meu prdprio trabalho com os Modelos 
Hierarquicos Ocultos de Markov. Uma_ estimativa 
conservadora a partir de minha propria experiéncia 6 que 
para imitar um ciclo de um Unico identificador de padrdes no 
neocdértex de um cérebro biolédgico precisariamos de uns 3 
mil calculos. A maioria das simulacdes é executada numa 
fracao dessa estimativa. Com o cérebro funcionando a razao 
de 102 (100) ciclos por segundo, teremos 3 x 10° (300 mil) 
calculos por segundo por identificador de padroes. Usando 
minha estimativa de 2 x 108 (300 milhdes) de 
identificadores de padrodes, terfamos cerca de 1014 (100 


trilhdes) de calculos por segundo, um numero consistente 
com minha estimativa apresentada em The singularity is 
near. Nesse livro, projetei que para simular o cérebro de 
maneira funcional precisariamos de um numero entre 1014 e 
101© calculos por segundo (cps), e usei 101° cps para ser 
conservador. A estimativa do especialista em IA Hans 
Moravec, baseada na_ extrapolagao dos_ requisitos 
computacionais do processamento visual inicial do cérebro 
como um todo, é de 10!4 cps, o que corresponde a minha 
avaliacao. 

Maquinas de desktop podem atingir 101° cps, embora 
esse nivel de desempenho possa ser significativamente 
ampliado usando-se recursos da nuvem. O supercomputador 
mais veloz, o K Computer, do Japao, ja atingiu 102° cps [8]. 
Como o algoritmo do neocértex se repete macicamente, a 
abordagem de se usar chips neuromorficos como os chips 
SyNAPSE da IBM, mencionados acima, também é 
promissora. 

Em termos de exigéncias de memoria, vamos precisar de 
cerca de 30 bits (quatro bytes) para que uma conexao se 
ocupe de um dos 300 milhoes de identificadores de padroes. 
Se estimarmos uma média de oito inputs para cada 
identificador de padrao, teremos 32 bytes por identificador. 
Se acrescentarmos um peso de um byte para cada input, 
teremos 40 bytes. Acrescente outros 32 bytes para conexoes 
descendentes e somamos 72 bytes. Perceba que o numero 
da ramificacao para cima e para baixo sera bem superior a 
oito, embora essas arvores de ramificagcao muito grandes 
sejam compartilhadas por diversos identificadores. Por 
exemplo, pode haver centenas de identificadores envolvidos 
na identificacao da letra “p”. Estes vao alimentar milhares 


de identificadores no nivel imediatamente superior que 
lidam com palavras e frases que incluem “p”. No entanto, 
cada identificador de “p” nao repete a arvore de conexédes 
que alimenta todas as palavras e frases que incluem “p” - 
todos compartilham uma de taiS arvores de conexdes. O 
mesmo se aplica a conexdes descendentes: um identificador 
responsavel pela palavra “APPLE” vai dizer a todos os 
milhares de identificadores de “E” num nivel inferior que um 
“E” sera esperado caso ja tenham sido vistos “A”, “P”, “P” e 
“L', Essa arvore de conexdes nao se repete para cada 
identificador de palavra ou de frase que quer informar o 
nivel imediatamente inferior que um “E” @ esperado. Mais 
uma vez, eles sao compartilhados. Por esse motivo, uma 
estimativa geral de oito para cima e oito para baixo, em 
média, por identificador de padrées, é razoavel. Mesmo que 
aumentemos essa estimativa em particular, isso nao 
aumentara significativamente a ordem de magnitude da 
estimativa resultante. 

Com 3 x 108 (300 milhées) de identificadores de padrées 
com 72 bytes cada, teremos uma necessidade geral de 
memoria da ordem de 2 x 10?°9 (20 bilhées) de bytes. Trata- 
se de um numero até modesto, que os computadores 
normais atuais podem exceder. 

Essas estimativas t@ém o objetivo apenas de proporcionar 
uma nocao aproximada da ordem de grandeza exigida. 
Lembrando que os circuitos digitais sao intrinsecamente 
cerca de 10 milhdes de vezes mais rapidos do que os 
circuitos neocorticais bioldgicos, nao precisamos igualar o 
cérebro humano em seu paralelismo - um processamento 
paralelo modesto (comparado com o paralelismo da ordem 
de trilhé6es de vezes do cérebro humano) sera suficiente. 


Percebemos que os requisitos computacionais necessarios 
estao ficando ao nosso alcance. O recabeamento do préprio 
cérebro - os dendritos estao criando novas sinapses 
continuamente - também pode ser emulado por software 
usando links, um sistema bem mais flexivel do que 0 método 
de plasticidade do cérebro, que, como vimos, é4 
impressionante, porém limitado. 

A redundancia usada pelo cérebro para atingir resultados 
invariantes robustos certamente pode ser replicada em 
emulacoes por software. A matematica para se otimizar 
esses tipos de sistemas de aprendizado hierarquico auto- 
organizados € bem conhecida. A organizacao do cérebro 
esta longe de ser a ideal. Naturalmente, nem preciSava sé- 
lo; ela sO precisa ser boa o suficiente para se atingir o limiar 
da possibilidade de criar ferramentas que compensam suas 
proprias limitacdes. 

Outra restri¢ao do neocdértex humano é€ que nao existe 
processo que elimine ou mesmo revise ideias contraditorias, 
oO que explica a razao pela qual o pensamento humano 
costuma ser macicamente' inconsistente. Temos um 
mecanismo fraco para lidar com isso, chamado pensamento 
critico, mas essa habilidade nao é, nem de longe, tao 
praticada quanto deveria. Num neocortex baseado em 
software, podemos construir um processo que revela 
inconsisténcias que serao analiSadas mais a fundo. 

E importante observar que o desenho de toda uma regiao 
cerebral € mais simples do que o desenho de um unico 
neur6nio. Como discuti antes, os modelos costumam ficar 
mais simples num nivel superior - pense na analogia com 
um computador. Precisamos compreender em detalhes a 
fisica dos semicondutores para modelar um transistor, e as 
equacdes por tras de um unico transistor real sao 


complexas. Um circuito digital que multiplica dois nuUmeros 
exige centenas deles. Mas podemos modelar esse circuito de 
multiplicag¢ao de forma bem simples, com uma ou duas 
formulas. Um computador inteiro com bilhées de transistores 
pode ser modelado através de seu conjunto de instrucées e 
da descri¢ao dos registros, que podem ser descritos num 
punhado de paginas escritas com textos e férmulas. Os 
programas de software de um sistema operacional, os 
compiladores de _ linguagem e@ os _ montadores’ sao 
razoavelmente complexos, mas a modelagem de um 
programa especifico - por exemplo, um programa de 
reconhecimento de fala baseado em Modelos Hierarquicos 
Ocultos de Markov - também pode ser descrito em poucas 
paginas de equacdes. Em nenhum ponto dessa descri¢gao 
encontrariamos os detalhes da fisica dos semicondutores, 
nem mesmo da arquitetura de computadores. 

Uma observacao similar @ valida para o cérebro. Um 
identificador neocortical de padr6ées especifico, que detecta 
uma caracteristica visual invariante em particular (Como um 
rosto) ou que realiza uma filtragem de passo de faixa 
(limitando o input a uma gama de frequéncias especifica) 
num som, ou que avalia a proximidade temporal de dois 
eventos, pode ser descrito com muito menos detalhes 
especificos do que a fisica e as relacdes quimicas que 
controlam os neurotransmissores, oS canais de fons e outras 
variaveis sinapticas e dendriticas envolvidas nos processos 
neurais. Embora toda essa complexidade precise ser 
cuidadosamente avaliada antes de avancar para o préximo 
nivel conceitual superior, boa parte dela pode ser 
simplificada quando os principios operacionais do cérebro 
sao revelados. 


¢ Capitulo 9 « 


Experimentos mentais sobre a mente 


A mente nada mais é do que aquilo que o cérebro faz. 
- Marvin Minsky, A sociedade da mente 


Quando forem construidas maquinas inteligentes, nado deveremos 
nos surpreender se elas forem tao confusas e teimosas quanto os 
homens em suas conviccées sobre mente-matéria, consciéncia, livre- 
arbitrio e coisas do género. 

- Marvin Minsky, A sociedade da mente 


Quem é consciente? 


A verdadeira hist6ria da consci€ncia comeca com nossa primeira 
mentira. 
- Joseph Brodsky 


O sofrimento 6 a Unica origem da consciéncia. 
- Fiddor Dostoiévski, Memorias do subsolo 


Ha um tipo de planta que se alimenta de comida organica com suas 
flores: quando um inseto pousa sobre a flor, as pétalas se fecham 
sobre ele e o prendem até a flor ter absorvido o inseto em seu 
sistema; mas ela so se fecha sobre aquilo que é bom para se comer; 
se for uma gota de chuva ou um graveto, ela nao se abala. Curioso 
ver que uma coisa inconsciente tem um olho clinico para aquilo que 
Ihe interessa. Se isso 6 inconsciéncia, para que serve a consciéncia? 

- Samuel Butler, 1871 


xaminamos o cérebro como uma entidade capaz de certos 
niveis de realizacao. Mas essa perspectiva deixa nossos 
- eus fora do quadro. Aparentemente, vivemos em nosso 
cérebro. Temos vidas subjetivas. De que maneira a visao 
objetiva do cérebro, que discutimos até agora, se relaciona 
com nossos sentimentos, com a sensacao de que somos a 
pessoa que esta tendo as experiéncias? 

O fildsofo inglés Colin McGinn (nascido em 1950) trata 
disso, dizendo que “a consciéncia pode reduzir até o 
pensador mais meticuloso a um balbuciar incoerente”. A 
razao para isso € que as pessoas costumam ter opinides 
inconsistentes e nao examinadas sobre o significado exato 
da expressao. 

Muitos observadores consideram a consciéncia uma 
forma de representacao; por exemplo, a capacidade de 
autorreflexao, ou seja, a habilidade de compreendermos 
nossos proprios pensamentos e de_ explica-los. Eu 
descreveria isso como a capacidade de pensar sobre nosso 
proprio pensamento. Presumivelmente, deveriamos 
encontrar um modo de avaliar essa capacidade, usando 
depois esse teste para separar coisas conscientes de coisas 
inconscientes. 

No entanto, deparamos rapidamente com problemas 
quando tentamos pér em pratica essa abordagem. Um bebé 
tem consciéncia? Um cao? Eles nao tém la muita habilidade 
para descrever seus processos mentais. Ha quem acredite 
que bebés e caes nao sao seres conscientes justamente 
porque nao conseguem se explicar. E o que dizer do 
computador conhecido como Watson? Ele pode ser posto 
num modo no qual efetivamente explica de que forma 
encontrou determinada resposta. Como ele contém um 


(ays 


modelo de seu prdprio pensamento, sera que Watson 
consciente, enquanto o bebé e o cachorro nao sao? 

Antes de continuarmos a explorar essa questao, é 
importante refletir sobre a disting¢ao mais importante 
relacionada com ela: o que podemos descobrir pela ci€ncia e 
Oo que se mantém de fato como uma questao da filosofia? 
Uma posicao diz que a filosofia € uma espécie de depésito 
intermediario para perguntas que ainda nao sucumbiram ao 
método cientifico. Segundo essa perspectiva, quando a 
ci€ncia progride o suficiente para resolver determinado 
conjunto de questoées, os fildsofos podem passar para outras 
perguntas, até chegar 0 momento em que a cié@ncia as 
elucida também. Essa visao 6 endémica no que diz respeito 
ao problema da consciéncia, e, mais especificamente, “o que 
e quem é consciente?” 

Pense nestas declaracodes do fildsofo John Searle: 
“Sabemos que os cérebros causam a consciéncia com 
mecanismos bioldgicos especificos. [...] O essencial é 
perceber que a consciéncia € um processo bioldgico como a 
digestao, a lactacao, a fotossintese ou a mitose. [...] O 
cérebro € uma maquina, Maquina bioldédgica, claro, mas ainda 
assim uma maquina. Logo, a primeira etapa consiste em 
descobrir como o cérebro a cria para construirmos depois 
uma maquina artificial com um mecanismo igualmente 
eficiente para causar a_consciéncia_ [1]”. As pessoas 
costumam se surpreender ao lerem essas frases porque 
presumem que Searle se dedica a proteger o mistério da 
consciéncia de reducionistas como Ray Kurzweil. 

O fildsofo australiano David Chalmers (nascido em 1966) 
criou a expressao “o duro problema da consciéncia” para 
descrever a_ dificuldade de enquadrar esse conceito 
essencialmente indescritivel. As vezes, uma frase breve 


engloba tao bem toda uma escola de pensamento que se 
torna emblematica (como “a banalidade do mal”, de Hannah 
Arendt). A famosa formulagcao de Chalmers faz isso muito 
bem. 

Quando se discute a consciéncia, fica muito facil incorrer 
no erro de considerar os atributos observaveis e 
mensuraveiS que associamos com o fato de sermos 
conscientes, mas essa abordagem nao trata da verdadeira 
esséncia da ideia. Acabei de mencionar o conceito da 
metacognicao - a ideia de se pensar sobre o prdprio 
pensamento - como um de tais correlatos da consciéncia. 
Outros observadores equiparam a inteligéncia emocional ou 
a intelig€ncia moral com a consciéncia. Mais uma vez, 
porém, nossa capacidade de expressar um sentimento 
amoroso, de compreender uma piada ou de sermos sensuais 
sao simplesmente tipos de _ representacao -_ até 
impressionantes e inteligentes, mas habilidades que podem 
ser observadas e medidas (embora possamos questionar 
como podemos avalia-las). Entender como o cérebro realiza 
esse tipo de tarefa e 0 que acontece no cérebro quando as 
realizamos constitui a questao “facil” de Chalmers sobre a 
consciéncia. Naturalmente, o problema “facil” pode ser tudo, 
menos facil, e talvez represente a mais dificil e importante 
busca cientifica de nossa era. Enquanto isso, a questao 
“dura” de Chalmers é tao dura que se_ mostra 
essencialmente inefavel. 

Apoiando essa distingao, Chalmers’ introduz um 
experimento mental envolvendo o que ele chama de 
zumbis. O zumbi @€ uma entidade que atua como uma 
pessoa, mas simplesmente nao tem experiéncia subjetiva, 
ou seja, um zumbi nao tem consciéncia. Chalmers alega que 
como podemos conceber zumbis, eles sao possiveis, pelo 


menos em termos Idégicos. Se vocé estivesse numa festa e 
nela houvesse tanto humanos “normais” como zumbis, como 
vocé perceberia a diferenca? Talvez isso até se pareca com 
alguma festa na qual vocé esteve. 

Muitos respondem a essa questao dizendo que 
perguntariam aos individuos que desejam avaliar quais as 
Suas reacgdes emocionais a eventos e ideias. Segundo 
acreditam, um zumbi revelaria sua falta de experiéncia 
subjetiva por meio de uma deficiéncia em certos tipos de 
resposta emocional. Mas uma resposta nesse_ sentido 
deixaria de levar em conta as premissas do experimento 
mental. Se encontrarmos uma pessoa nao emocional (como 
um individuo com certas deficiéncias emocionais, como é 
comum em certos tipos de autismo), ou um avatar, ou uM 
rob6 que nao se mostrou convincente como ser humano 
emocional, entao essa entidade nao € um zumbi. Lembre-se: 
segundo a premissa de Chalmers, 0 zumbi &€ completamente 
normal em sua capacidade de reagir, inclusive a capacidade 
de reagir emocionalmente; ele sO nao tem experiéncia 
subjetiva. O fundo da questao é€ que nao ha maneira de 
identificarmos um zumbi porque, por definicao, nao existe 
indicag¢ao aparente de sua natureza zumbi em _ seu 
comportamento. Assim, sera esta uma distingao sem uma 
diferenca? 

Chalmers nao tenta responder a questao dura, mas 
apresenta algumas possibilidades. Uma @ uma forma de 
dualismo na qual a consciéncia em si nao existe no mundo 
fisico, mas como uma entidade ontolégica separada. 
Segundo essa formulagao, aquilo que uma pessoa faz se 
baseia nos processos em seu cérebro. Como o cérebro é 
causalmente fechado, podemos explicar plenamente as 
acoes de uma pessoa, inclusive seus pensamentos, por meio 


de seus’ processos. Assim, a consciéncia existe 
essencialmente noutra esfera, ou, no minimo, @ uma 
propriedade separada do mundo fisico. Essa explicacao nao 
permite que a mente (quer dizer, a propriedade consciente 
associada com o cérebro) afete causalmente o cérebro. 

Outra possibilidade sugerida por Chalmers, que nao 
difere logicamente de seu conceito de dualismo, e que 
costuma ser chamada de panprotopsiquismo, sustenta que 
todos os sistemas fisicos sao conscientes, embora um ser 
humano seja mais consciente do que um interruptor de luz, 
por exemplo. Eu certamente concordo; um cérebro humano 
precisa ter mais consciéncia do que um interruptor de luz. 

Minha opiniao, que talvez seja uma subescola do 
panprotopsiquismo, € que a consciéncia 6 uma propriedade 
emergente de um sistema fisico complexo. Segundo essa 
visao, um cao também tem consciéncia, mas esta € um 
pouco menor do que a humana. Uma formiga também tem 
certo nivel de consciéncia, mas muito menor que a de um 
cao. Por outro lado, podemos considerar que a colénia de 
formigas tem um nivel de consciéncia superior ao de cada 
formiga; ela 6, com certeza, mais inteligente do que uma 
formiga isolada. Segundo essa linha, um computador que 
imita com sucesso a complexidade de um cérebro humano 
também teria a mesma consciéncia emergente que um 
humano. 

Outra maneira de conceituar a consciéncia € como um 
sistema que tem “qualia”. E 0 que sao os qualia? Uma 
defini¢ao do termo seria “experi@ncias conscientes”. Isso, 
porém, nao nos leva muito longe. Imagine este experimento 
mental: um neurocientista 6 completamente cego para cores 
- nao é daltdnico, ou seja, nao confunde certos tons de 
verde e vermelho (como eu); tem um problema no qual o 


individuo vive num mundo totalmente preto e branco. 
(Numa versao mais extrema desse cenario, ele cresceu num 
mundo preto e branco e nunca viu cor nenhuma. Em sintese, 
seu mundo nao tem cores.) Contudo, ele estudou a fundo a 
fisica da cor - ele sabe que 0 comprimento de onda da luz 
vermelha € 700 nandémetros - e os processos neuroldégicos 
de uma pessoa que consegue lidar normalmente com as 
cores, e que portanto conhece muita coisa sobre 0 modo 
como o cérebro processa cores. Esse individuo sabe mais 
coisas sobre as cores do que a maioria das pessoas. Se vocé 
quisesse ajuda-lo, explicando-lhe como é a verdadeira 
experiéncia do “vermelho”, como poderia fazé-lo? 

Vocé poderia ler para ele um trecho do poema 
“Vermelho”, do poeta nigeriano Oluseyi Oluseun: 


Vermelho a cor do sangue 
simbolo da vida 

Vermelho a cor do perigo 
simbolo da morte 


Vermelho a cor das rosas 
simbolo da beleza 

Vermelho a cor dos enamorados 
simbolo da unidade 


Vermelho a cor do tomate 
simbolo da boa saude 
Vermelho a cor do fogo quente 
simbolo do desejo ardente 


Isso Ihe daria uma excelente ideia de algumas das 
associagodes que as pessoas fizeram com o vermelho, e 
poderia até leva-lo a ter uma posi¢cao numa conversa sobre 


essa cor. (“Sim, adoro a cor vermelha, é tao quente e fogosa, 
tao perigosamente bela...”) Se ele quisesse, poderia até 
convencer as pessoas de que tinha vivenciado o vermelho, 
mas toda a poesia do mundo nao permitiria efetivamente 
que ele tivesse essa vivéncia. 

De modo analogo, como vocé explicaria a sensacgao de 
mergulhar na agua para alguém que nunca encostou na 
agua? Novamente, seriamos forcados a recorrer a poesia, 
mas nao ha de fato um modo de transmitir a experiéncia em 
si. SAO essas experiéncias que chamamos de qualia. 

Muitos dos leitores deste livro experimentaram a cor 
vermelha. Mas como eu sei se sua experiéncia de vermelho 
nao € a mesma experiéncia que tenho ao olhar para o azul? 
Nos dois olhamos para um objeto vermelho e afirmamos com 
seguranca que ele é vermelho, mas isso nao responde a 
pergunta. Eu posso estar tendo a experiéncia que vocé tem 
ao olhar para o azul, mas ambos aprendemos a chamar as 
coisas vermelhas de vermelhas. Poderfamos comecar a 
trocar poemas novamente, mas eles’ simplesmente 
refletiriam aS associacdes que as pessoas tém feito com as 
cores; eles nao falam da verdadeira natureza do qualia. Com 
efeito, cegos de nascenca ja leram muito sobre cores, pois 
essas referéncias sao abundantes na literatura, e por isso 
eles tam alguma versao de uma experiéncia da cor. Como 
Sua experiéncia do vermelho se compara com a experiéncia 
de pessoas dotadas de visao? Essa € a mesma pergunta que 
aquela feita sobre a pessoa no mundo preto e branco. E 
notavel como fenédmenos tao comuns em nossas vidas sao 
inefaveis e tornam uma confirmacao simples, como a de que 
estamos tendo 0 mesmo qualia, impossivel. 

Outra definicao de qualia @€ o sentimento de uma 
experiéncia. No entanto, essa defini¢ao nao é menos circular 


do que nossas tentativas anteriores de definir a consciéncia, 
pois as expressoes “sentimento”, “ter uma experiéncia” e 
“consciéncia” sao sindnimas. A consciéncia e a questao 
intimamente relacionada a ela do qualia sao uma questao 
filosdfica fundamental, talvez a questao suprema (embora o 
tema da identidade possa ser ainda mais importante, como 
vou discutir na secao final deste capitulo). 

Portanto, com relacao a consciéncia, qual € mesmo a 
pergunta? E esta: quem ou 0 que € consciente? Refiro-me a 
“mente” no titulo deste livro, e nao a “cérebro”, pois a 
mente é um cérebro que é consciente. Também poderiamos 
dizer que a mente tem livre-arbitrio e identidade. A alegacao 
de que essas questodes sao filosdficas nao é evidente por si 
so. Afirmo que essas questdes nunca poderao ser 
plenamente resolvidas pela ciéncia. Noutras palavras, nao 
ha experimentos falsificaveis que possamos imaginar para 
resolvé-las, nao sem assumirmos premissas filosdficas. Se 
estivéssemos construindo um detector de consciéncia, 
Searle desejaria se assegurar de que ele estaria esoremendo 
neurotransmissores biolédgicos. O fildsofo norte-americano 
Daniel Dennett (nascido em 1942) seria mais flexivel no 
substrato, mas poderia querer determinar se o sistema 
continha ou nao um modelo de si mesmo e de Sua propria 
representacao. Essa visao se aproxima mais da minha, mas, 
em esséncia, ainda 6 uma premissa filosofica. 

Muitas propostas tém sido apresentadas regularmente 
com a pretensao de serem teorias cientificas associando a 
consciéncia a algum atributo fisico mensuravel, aquilo a que 
Searle se refere como “o mecanismo que causa a 
consciéncia”. O cientista, fildsofo e anestesiologista norte- 
americano Stuart Hameroff (nascido em 1947) escreveu que 
“filamentos citoesqueléticos sao as raizes da consciéncia 


[2]”. Ele se refere a fios finos presentes em todas as células 
(inclusive nos neurdnios, mas nao se limitando a eles) 
chamados microtubulos, que dao a cada célula integridade 
estrutural e tem um papel na divisao celular. Seus livros e 
trabalhos sobre essa questao contém equacées e descricdes 
detalhadas que explicam aé_ plausibilidade de que os 
microtubulos tenham um papel no processamento de 
informacgoes dentro da célula. Mas a conexao entre os 
microtubulos e a consciéncia exige um salto de fé, 
fundamentalmente em nada diferente do salto de fé 
implicito numa doutrina religiosa que descreve um ser 
supremo conferindo a consciéncia (as vezes chamada de 
“alma”) a certas entidades (geralmente humanas). Uma 
evidéncia fraca foi apresentada para a posicao de Hameroff, 
especificamente a observacao de que os_ processos 
neurol6gicos que poderiam apoiar esse suposto cémputo 
celular sao interrompidos durante uma anestesia. Mas isso 
esta longe de ser uma confirmacao convincente, tendo em 
vista que muitos processos sao interrompidos durante uma 
anestesia. Nao podemos nem mesmo dizer com certeza que 
os sujeitos nao estao conscientes quando sao anestesiados. 
S6 sabemos que as pessoas nao se lembram de suas 
experiéncias depois. E nem isso é universal, pois algumas 
pessoas se lembram - com precisao - de sua experiéncia 
enquanto estao sob efeito de anestesia, inclusive, por 
exemplo, conversas de seus cirurgides. Chamado percepcao 
anestésica, estima-se que esse fendmeno ocorra cerca de 40 
mil vezes por ano nos Estados Unidos [3]. Mas, mesmo 
deixando-o de lado, consciéncia e memoria sao conceitos 
completamente diferentes. Como ja discuti amplamente, se 
eu penso nas experiéncias do dia anterior, momento a 
momento, tive um grande numero de impress6es sensoriais, 


mas me lembro de muito poucas delas. Sera que por isso 
nao estive consciente daquilo que vi e ouvi o dia todo? E 
uma boa pergunta, na verdade, e a resposta nao é muito 
Clara. 

O fisico e matematico inglés Roger Penrose (nascido em 
1931) deu um salto de fé diferente ao propor a fonte da 
consciéncia, embora também~ esteja_ tratando dos 
microtubulos - especificamente, sua suposta capacidade de 
cOmputos quanticos. Seu raciocinio, embora nao seja 
explicitamente declarado, parece ser o de que a consciéncia 
€ misteriosa, e um evento quantico também é misterioso, e 
por isso eles devem ter algum tipo de liame. 

Penrose comecou sua analise com os teoremas de Turing 
sobre problemas insoluveis e com o analogo teorema da 
incompletude, de Godel. A premissa de Turing (que foi 
discutida com detalhes no capitulo 8) @ que ha problemas 
algoritmicos que podem ser declarados mas que nao podem 
ser solucionados por uma maquina de Turing. Tendo em vista 
a universalidade computacional da maquina de Turing, 
podemos concluir que esses “problemas insoluveis” nao 
podem ser solucionados por nenhuma maquina. O teorema 
da incompletude de Godel tem um resultado similar com 
relacao a capacidade de provar conjecturas envolvendo 
numeros. O argumento de Penrose é que o cérebro humano 
€ capaz de resolver esses problemas insoluveis, e portanto 
Capaz de fazer coisas que uma maquina deterministica como 
um computador é incapaz de fazer. Sua motivacgao, ao 
menos em parte, é elevar os seres humanos acima das 
maquinas. Mas sua premissa central - a de que os humanos 
podem resolver os problemas insoluveis de Turing e de 
Godel - infelizmente nao é verdadeira. 


Um famoso problema insoluvel chamado problema do 
castor atarefado é posto desta maneira: descubra o numero 
maximo de “1” que uma maquina de Turing com 
determinado numero de estados pode escrever em sua fita. 
Para determinar o castor atarefado do numero. nn, 
construimos todas as maquinas de Turing que tém n estados 
(que serao um numero finito caso n seja finito) e depois 
determinamos o maior numero de “1” que essas maquinas 
escrevem em suas fitas, excluindo aS maquinas de Turing 
que entram num laco infinito. Isso é insoluvel, pois quando 
tentamos simular todas essas maquinas de Turing com n 
estados, nosso simulador vai entrar num laco infinito ao 
tentar simular uma das maquinas de Turing que estao num 
laco infinito. Entretanto, mesmo assim os computadores 
conseguiram determinar a funcao do castor atarefado para 
certos ns. Os humanos também, mas os computadores 
resolveram o problema para bem mais ns do que os 
humanos desassistidos. Geralmente, os computadores sao 
melhores do que os humanos na solucao de problemas 
insoluveis de Turing e Godel. 

Penrose associou essasS capacidades alegadamente 
transcendentes do cérebro humano a computacao quantica 
que, segundo sua hipdtese, aconteceria nele. Segundo 
Penrose, esses efeitos quanticos neurais, de algum modo, 
nao eram obteniveis intrinsecamente pelos computadores, e 
por isso 0 pensamento humano tem uma vantagem inerente. 
De fato, a eletrénica comum usa efeitos quanticos (os 
transistores dependem da tunelizacao quantica dos elétrons 
através de barreiras); a computacao quantica do cérebro 
nunca foi demonstrada; o desempenho mental humano 
pode ser explicado satisfatoriamente por métodos classicos 
de computacao; e, de qualquer modo, nada nos impede de 


aplicar a computacao quantica a computadores. Nenhuma 
dessas objecdes foi alvo da atencao de Penrose. S6 depois 
que os criticos comentaram que o cérebro € um lugar morno 
e confuso para a computacao quantica € que Hameroff e 
Penrose uniram forcas. Penrose encontrou um _ veiculo 
perfeito nos neurdnios para realizar cCOmputos quanticos, ou 
seja, OS microtubulos que Hameroff havia especulado que 
faziam parte do processamento de informacoes dentro dos 
neurdénios. Assim, a tese de Hameroff-Penrose € que os 
microtubulos nos neurdnios estao fazendo cdmputos 
quanticos e que isso é responsavel pela consciéncia. 

Esta tese também foi criticada, por exemplo, pelo fisico e 
cosmologista sueco-americano Max Tegmark (nascido em 
1967), que determinou que eventos quanticos nos 
microtubulos sé conseguiam sobreviver durante 10-13 
segundos, um periodo breve demais, seja para calcular 
resultados de qualquer significancia, seja para afetar 
processos neurais. Ha certos tipos de problemas para os 
quais a computacao quantica mostraria capacidade superior 
a da computacao classica, como, por exemplo, a decifracao 
de céddigos cifrados através da fatoracao de numeros 
grandes. Contudo, 0 pensamento humano desassistido tem 
se mostrado péssimo para resolvé-los, e nao pode se igualar 
sequer aos computadores classicos nessa area, 0 que sugere 
que o cérebro nao esta demonstrando nenhuma capacidade 
quantica de computacao. Ademais, mesmo que existisse um 
fendmeno como a computacao quantica cerebral, ele nao 
seria necessariamente associado a consciéncia. 


Vocé precisa ter fe 


Que obra de arte € 0 homem! Quao nobre na razdo! Quao infinito 
nas faculdades! Na forma e nos movimentos, quao determinado e 
admiravel! Em acdo, como se parece com um anjo! Na apreensao, 
com um deus! A beleza do mundo, o paradigma dos animais! E, 
mesmo assim, 0 que é esta quintesséncia de pd? 

- Hamlet, em Hamlet, de Shakespeare 


A realidade 6 que todas essas teorias sao saltos de fé, e eu 
acrescentaria que, no que diz respeito a consciéncia, o 
principio orientador é este: “vocé precisa ter fé” - ou seja, 
cada um de nos precisa de um salto de fé com relacao a o 
que e quem é€ consciente, e quem e 0 que somos como seres 
conscientes. Do contrario, nao acordariamos de manha. Mas 
deverfamos ser honestos com relacao a_ necessidade 
fundamental de um salto de fé sobre essa questao, e 
refletirmos sobre o que envolve nosso salto. 

As pessoas dao saltos muito diferentes, apesar das 
impressoes em contrario. As premissas filoséficas individuais 
sobre a natureza e a fonte da consciéncia estao por tras de 
desentendimentos sobre assuntos que vao de direitos dos 
animais a aborto, e vao resultar em conflitos futuros ainda 
mais acirrados com relacao aos direitos das maquinas. Minha 
previsao objetiva é que, no futuro, aS maquinas parecerao 
conscientes e serao convincentes para pessoas bioldédgicas ao 
falarem de seus qualia. Exibirao toda a gama de sugest6es 
emocionais sutis e familiares; nos farao rir e chorar; e ficarao 
loucas conosco se dissermos que nao acreditamos que elas 
sao conscientes. (Elas serao muito inteligentes, e por isso 
nao vamos querer que isso aconteca.) Vamos acabar 
aceitando que sao pessoas conscientes. Meu proprio salto de 
fé 6: assim que aS maquinas conseguirem ser convincentes 
ao falarem de seus qualia e de suas experiéncias 
conscientes, elas constituirao de fato pessoas conscientes. 


Cheguei a essa posicao através deste experimento mental: 
imagine que vocé conheceu uma entidade no futuro (um 
rob6 ou um avatar), completamente convincente em suas 
reacodes emocionais. Essa entidade ri de suas piadas de 
forma convincente, e, por sua vez, faz vocé rir e chorar (mas 
nao porque beliscou vocé). Ela convence vocé de sua 
sinceridade ao falar de seus medos e anseios. De todas as 
maneiras, parece consciente. De fato, ela se parece com 
uma pessoa. Vocé a aceita Como uma pessoa consciente? 

Se a sua reacao inicial @€ que vocé provavelmente 
detectaria alguma coisa nela que revelaria sua natureza nao 
bioldgica, entao vocé nao esta respeitando as premissas 
dessa situacao hipotética, que estabeleceram que ela é 
totalmente convincente. Levando em conta essa premissa, 
se ela fosse ameacada de destruicao e reagisse, como um 
ser humano, com terror, vocé reagiria da mesma forma 
empatica como reagiria caso testemunhasse uma cena 
dessas envolvendo um ser humano? Para mim, a resposta é 
sim, e creio que a resposta seria a mesma para a maioria, se 
nao para praticamente todas as pessoas, 
independentemente do que poderiam dizer agora num 
debate filosdfico. Novamente, a énfase esta na palavra 
“convincente”. 

Ha certo desentendimento a respeito de encontrarmos ou 
nao essa entidade nao biolédgica um dia. Minha predicao 
consistente é que isso vai ocorrer pela primeira vez em 2029 
e se tornara rotina na década de 2030. Mas, deixando de 
lado a linha do tempo, creio que mais cedo ou mais tarde 
iremos considerar conscientes tais entidades. Pense como ja 
as tratamos quando somos expostos a elaS como 
personagens de historias e filmes: R2D2 de Guerra nas 
estrelas, David e Teddy do filme /nteligéncia artificial, Data 


da série de TV Jornada nas estrelas: A Nova Geracao, Johnny 
5 do filme Curto-circuito, WALL-E do filme Wall/-E, da Disney, 
T-800 - o (bom) exterminador - do segundo e do terceiro 
filme O exterminador do futuro, Rachael, a replicante de 
Blade Runner (que, por falar nisso, nao tem nocgao de que 
nao é€ humana), Bumblebee do filme, da série da TV e dos 
quadrinhos Transformers, e Sonny, do filme Eu, robo. 
Sentimos empatia por esses personagens, embora saibamos 
que nao sao bioldgicos. Ndés os consideramos pessoas 
conscientes, tal como fazemos com _ oSs_ personagens 
humanos biolégicos. Compartilhamos suas emocgoes e 
receamos por eles quando se metem em encrencas. Se é 
assim que tratamos personagens nao bioldgicos ficticios 
hoje, entao 6 assim que iremos tratar inteligéncias da vida 
real no futuro que, por acaso, nao t@m um substrato 
bioldgico. 

Se vocé aceitar o salto de fé de que uma entidade nao 
bioldgica que € convincente em suas reacgdes aos qualia é 
mesmo consciente, entao pense no que isso implica: a 
consciéncia 6 uma propriedade emergente do padrao geral 
de uma entidade, e nao o substrato que a move. 

Existe uma lacuna conceitual entre a ciéncia, que 
representa medicoes objetivas e as conclusoes que podemos 
extrair delas, e a consciéncia, que @€ um sinénimo de 
experiéncia subjetiva. Obviamente, nao  podemos 
simplesmente perguntar a entidade em questdao: “Vocé é 
consciente?” Se olharmos dentro de sua “cabeca”, bioldgica 
ou nao, para determinar isso, entao teremos de estabelecer 
premissas filosodficas para saber 0 que estamos procurando. 
Saber se uma entidade 6 ou nao consciente, portanto, nao é 
uma questao. cientifica. Com base nisso, alguns 
observadores se perguntam se a propria consciéncia tem 


alguma base na realidade. A escritora e fildsofa inglesa 
Susan Blackmore (nascida em 1951) fala da “grande ilusao 
da consciéncia”. Ela admite a realidade do meme (ideia) da 
consciéncia; noutras palavras, certamente a consciéncia 
existe como ideia, e ha muitas grandes estruturas 
neocorticais que lidam com essa ideia, para nem falar de 
palavras que foram ditas e escritas sobre ela. Mas nao esta 
claro se ela se refere a alguma coisa real. Blackmore explica 
que ela nao esta necessariamente negando a realidade da 
consciéncia, mas sim tentando expressar o tipo de dilema 
que encontramos quando tentamos determinar o conceito. 
Como o psicdélogo e escritor inglés Stuart Sutherland (1927- 
1998) escreveu no /nternational Dictionary of Psychology, “a 
consciéncia € um fendmeno fascinante, mas esquivo; é 
impossivel especificar o que ela 6, 0 que ela faz ou porque 
ela se desenvolveu [4]”. 

Entretanto, seria prudente nao descartar o conceito 
suMariamente como um debate educado entre fildsofos - 
que, por falar nisso, recua 2 mil anos até os dialogos 
platénicos. A ideia da consciéncia esta por tras de nosso 
sistema moral, e nosso sistema legal, por sua vez, foi mais 
ou menos construido em torno dessas crencas morais. Se 
uma pessoa extingue a consciéncia de outra, como no 
homicidio, consideramos isso imoral, e, com algumas 
excecdes, um crime grave. Essas excecdes também sao 
relevantes para a consciéncia, pois podemos autorizar forcas 
policiais ou militares a matar certas pessoas conscientes 
para proteger um numero maior de outras pessoas 
conscientes. Podemos discutir o mérito de excecdes 
especificas, mas 0 principio subjacente é valido. 

Atacar alguém e fazer com que essa pessoa experimente 
o sofrimento também costuma ser considerado imoral e 


ilegal. Se eu destruo minha propriedade, provavelmente é 
aceitavel. Se eu destruo sua propriedade sem permissao, 
provavelmente isso nao é aceitavel, mas nao porque estou 
causando sofrimento a sua propriedade, e sim a vocé como 
dono dela. Por outro lado, se minha propriedade inclui um 
ser consciente como um animal, entao eu, como dono desse 
animal, nao tenho necessariamente liberdade moral ou legal 
para fazer o que quiser com ele: ha, por exemplo, leis sobre 
a crueldade contra animais. 

Como boa parte de nosso sistema moral e legal se baseia 
na protecao da existéncia de entidades conscientes e na 
prevencao de seu sofrimento desnecessario, para fazermos 
juizos responsaveis temos de responder a pergunta: quem é 
consciente? Portanto, essa pergunta nao é simplesmente o 
tema de um debate intelectual, como fica evidente na 
controvérsia que cerca uma questao como o aborto. Devo 
dizer que a questao do aborto pode ir um pouco além da 
questao da consciéncia, pois os proponentes prd-vida 
alegam que o potencial para que um embridao se torne uma 
pessoa consciente @€@ motivo suficiente para receber 
protecao, assim como alguém em coma merece esse direito. 
Mas, no fundo, a questao 6 uma diScussao sobre 0 momento 
em que o feto se torna consciente. 

As percepcoes da consciéncia também costumam afetar 
nossos julgamentos em areas controvertidas. Analisando 
novamente a questao do aborto, muita gente faz uma 
distinc¢ao entre uma medida como a pilula do dia seguinte, 
que impede a implantacao de um embriao no utero nos 
primeiros dias de gravidez, e um aborto num estagio 
posterior. A diferencga tem a ver com a probabilidade de que 
o feto esteja consciente num estagio posterior. E dificil 
sustentar que um embriao com alguns dias possa ter 


consciéncia, a menos que se adote uma_ posicao 
panprotopsiquista, mas mesmo nesses termos ele estaria 
abaixo do animal mais simples em termos de consciéncia. 
De modo analogo, temos reacgdes muito diferentes quanto 
aos maus-tratos de grandes simios e quanto a insetos, 
digamos. Hoje em dia, ninguém se preocupa muito com a 
dor ou o sofrimento de um programa de computador 
(embora comentemos muito o fato de o software ter a 
Capacidade de nos fazer sofrer), mas quando um software 
futuro tiver a inteligéncia intelectual, emocional e moral de 
seres humanos bioldégicos, essa preocupacao se tornara real. 

Portanto, minha posicao é que aceitaremos entidades nao 
bioldgicas que sejam plenamente convincentes em suas 
reacdes emocionais a ponto de serem pessoas conscientes, e 
minha previsao 6 que o consenso da sociedade vai aceita-las 
como tal. Note que essa definicao se estende além de 
entidades que podem passar pelo teste de Turing, que exige 
0 dominio da linguagem humana. Estas sao humanas o 
suficiente para que eu as inclua, e creio que a maior parte 
da sociedade também o fara, mas eu também incluo 
entidades que evidenciam reagoes emocionais semelhantes 
as humanas, mas que talvez nao passem pelo teste de 
Turing, como criancgas pequenas, por exemplo. 

Isso resolve a questao filosdfica sobre quem é consciente, 
pelo menos para mim e para outros que aceitam esse salto 
de fé especifico? A resposta é: nao totalmente. S6 cobrimos 
um caso, que € o das entidades que agem de maneira 
semelhante a humana. Embora estejamos discutindo futuras 
entidades que nao sao bioldédgicas, estamos falando de 
entidades que demonstram reacdes semelhantes as 
humanas convincentes, e por isso essa posi¢cao ainda é 
humanocéntrica. Mas, o que falar de formas de inteligéncia 


mais estranhas, que nao sao semelhantes as humanas? 
Podemos imaginar intelig@ncias que sao tao complexas 
quanto cérebros humanos, ou talvez muito mais complexas 
e intricadas do que estes, mas que tém emocoes e 
motivagdes completamente diferentes. Como decidimos se 
elas sao conscientes ou nao? 

Podemos comecar analisando criaturas do mundo 
bioldgico que possuem cérebros comparaveiS aos dos 
humanos, mas que exibem comportamentos de tipos muito 
diferentes. O fildsofo inglés David Cockburn (nascido em 
1949) escreveu sobre um video a que assistiu no qual uma 
lula-gigante estava sendo atacada (ou que, no minimo, 
imaginou que estivesse sendo - Cockburn levantou a 
hipdtese de que ela deve ter ficado com medo do humano 
com camera de video). A lula tremeu e se recolheu, e 
Cockburn escreveu: “Ela reagiu de um modo que, na mesma 
hora e com grande intensidade, imaginei que fosse medo. 
Parte do que foi notavel nessa sequéncia foi o modo pelo 
qual foi possivel ver, no comportamento de uma criatura 
fisicamente tao diferente dos seres humanos, uma emocao 
tao inconfundivel e especifica quanto _o medo [5]”. Ele 
conclui que o animal estava sentindo essa emocao e 
demonstra acreditar que a maioria das pessoas que viram 
esse filme chegou a mesma conclusao. Se aceitarmos a 
descri¢ao e a conclusao de Cockburn, entao teremos de 
acrescentar as lulas-gigantes a nossa lista de entidades 
conscientes. No entanto, isso também nao nos levou muito 
longe, pois ainda estamos baseados em nossa reacao 
empatica a uma emocao que percebemos em nés mesmos. 
Ainda estamos dentro de uma perspectiva autocéntrica ou 
humanocéntrica. 


Se sairmos da biologia, a inteligéncia nao bioldgica sera 
ainda mais variada do que a inteligéncia no mundo 
bioldgico. Por exemplo, algumas entidades podem nao 
recear sua propria destruicao, e podem nao precisar das 
emocoes que vemos nos humanos ou em qualquer criatura 
bioldgica. Talvez elas ainda passem no teste de Turing, ou 
talvez nem estejam dispostas a tentar. 

De fato, hoje nds construimos robés que nao tém um 
senso de autopreservagao para realizar missoes em 
ambientes perigosos. Eles nao t@ém a complexidade nem a 
inteligéncia suficiente para que consideremos a sério sua 
sensibilidade, mas podemos imaginar robés futuros desse 
tipo que sao tao complexos quanto os humanos. O que dizer 
deles? 

Pessoalmente, eu diria que se visse no comportamento 
de um aparelho desses uma dedicag¢ao a uma meta 
complexa e digna, e€ a capacidade de executar decisoes e 
acoes notaveis para a realizacao de sua missao, eu ficaria 
impressionado e provavelmente me sentiria mal se ele fosse 
destruido. Talvez eu esteja forcando um pouco o conceito, 
pois estou reagindo a um comportamento que nao inclui 
muitas emocoes que consideramos universais nas pessoas 
ou mesmo em criaturas biol6égicas de todos os tipos. Porém, 
mais uma vez, estou tentando entrar em contato com 
atributos que eu posso avaliar em mim e em outras pessoas. 
A ideia de uma entidade totalmente dedicada a uma meta 
nobre, que a realiza ou pelo menos tenta fazé-lo sem 
consideragao por seu prdprio bem-estar, nao é, afinal, 
completamente alheia a experiéncia humana. Nesse caso, 
também estamos levando em conta uma entidade que esta 
buscando proteger seres humanos bioldgicos, ou, de algum 
modo, defendendo nossos interesses. 


E se essa entidade tivesse suas prdprias metas, distintas 
das de um humano, e nao estivesse realizando uma missao 
que, segundo nossos termos, identificamos como nobre? 
Entao, eu poderia tentar descobrir se conseguiria me 
conectar com algumas de suas habilidades ou aprecia-las de 
outro modo. Se ela for realmente muito inteligente, 
provavelmente deve ser boa em matematica, e assim talvez 
eu possa conversar com ela sobre esse assunto. Talvez ela 
aprecie piadas sobre matematica. 

Mas se a entidade nao tiver interesse em se comunicar 
comigo, e eu nao tiver acesso suficiente as suas acgdes e 
tomadas de decisao para me comover com a beleza de seus 
processos internos, isso significa que ela nao é consciente? 
Eu teria de concluir que as entidades que nao conseguem 
me convencer de suas reacdes emocionais, ou que nao se 
esfor¢am para tentar, nao sao necessariamente nao 
conscientes. Seria dificil reconhecer outra entidade 
consciente sem estabelecer algum nivel de comunicac¢ao 
empatica, mas esse julgamento reflete minhas prdprias 
limitagoes, mais do que a entidade sendo levada em conta. 
Portanto, precisamos prosseguir com humildade. Ja é 
desafiador nos colocarmos nos sapatos subjetivos de outro 
ser humano; a_ tarefa sera muito mais dificil com 
intelig@ncias extremamente diferentes da nossa. 


Do que temos consciéncia? 


Se pudéssemos ver através do cranio e contemplar o cérebro de 
uma pessoa consciente e pensante, e o lugar da excitabilidade ideal 
estivesse luminoso, entao veriamos, brincando sobre a superficie do 
cérebro, um ponto luminoso com bordas fantasticas e ondulantes, 
com tamanho e forma flutuando constantemente, cercado por uma 
escuridao mais ou menos profunda, cobrindo o resto do hemisfério. 


- lvan Petrovich Pavlov, 1913 [6] 








Retornando a lula-gigante, podemos identificar algumas de 
SuaS emocgoes aparentes, mas boa parte de seu 
comportamento é@ um mistério. O que significa ser uma lula- 
gigante? Como ela se sente ao espremer seu corpo sem 
coluna vertebral através de uma pequena abertura? Nao 
temos nem mesmo o vocabulario para responder a essa 
pergunta, uma vez que nao podemos nem mesmo descrever 
experiéncias que compartilhamos com outras pessoas, como 
enxergar a cor vermelha ou sentir a agua batendo em nosso 
corpo. 

Mas nao preciSamos ir ao fundo do oceano para encontrar 
mistérios na natureza das experiéncias conscientes - basta 
analisarmos as nossas. Sei, por exemplo, que sou consciente. 
Presumo que vocé, leitor, também seja consciente. (Quanto 
as pessoas que nao compraram meu livro, nao tenho tanta 
certeza.) Mas, de que tenho consciéncia? Talvez vocé se faca 
a mesma pergunta. 

Faca este experimento mental (que vai funcionar para 
aqueles que dirigem carros): imagine-se na faixa esquerda 
de uma estrada. Agora, feche os olhos, agarre um volante 
imaginario e faca os Movimentos para passar para a faixa a 
Sua direita. 

Certo, antes de continuar a ler, experimente fazé-lo. 

Eis o que vocé deve ter feito: vocé segura o volante. 
Certifica-se de que a faixa da direita esta livre. Presumindo 
que a faixa esta livre, vocé vira o volante para a direita por 
um breve momento. Depois, vocé o endireita. Missao 
cumprida. 

Ainda bem que vocé nao estava num carro de verdade 
porque vocé cruzou todas as faixas da estrada e bateu numa 


arvore. Embora eu devesse ter mencionado que vocé nao 
deve tentar fazer isso num carro que esta realmente em 
movimento (mas eu presumi que vocé ja deve ter dominado 
a regra que diz que nao se deve dirigir de olhos fechados), o 
problema central nao é esse. Se vocé seguiu 0 procedimento 
que acabei de descrever - e quase todos o fazem ao realizar 
este experimento mental -, vocé fez errado. Virar o volante 
para a direita e depois endireita-lo faz com que o carro tome 
uma direcao diagonal a sua direcao original. Ele vai 
atravessar a faixa para a direita, como vocé queria, mas 
depois vai seguir indefinidamente em frente até sair da 
rodovia. O que vocé precisava fazer assim que seu carro 
cruzou para a faixa da direita era virar o volante para a 
esquerda, na mesma proporgao com que o virou para a 
direita, endireitando-o depois. Com isso, 0 carro vai seguir 
novamente uma linha reta sobre a nova faixa. 

Pense que, se vocé costuma dirigir, deve ter feito essa 
manobra milhares de vezes. Vocé nao esta consciente 
quando faz isso? Nunca prestou atencao naquilo que esta 
fazendo de fato ao trocar de faixa? Presumindo que vocé 
nao esta lendo este livro num hospital enquanto se recupera 
de um acidente causado por troca de faixas, certamente ja 
dominou essa habilidade. Mas vocé nao esta consciente do 
que faz, por mais que tenha realizado essa acao. 

Quando as_ pessoas contam. histdrias de suas 
experiéncias, elas aS descrevem como sequéncias de 
situacdes e decisoes. Mas nao é assim que vivenciamos uma 
histéria pela primeira vez. Nossa experiéncia original € como 
uma sequéncia de padroes de alto nivel, alguns dos quais 
podem ter ativado sentimentos. Lembramo-nos de um 
pequeno subconjunto de padroes, se tanto. Mesmo se 
formos razoavelmente precisos ao tornar a contar uma 


historia, USamos nossos poderes de confabulacao para 
preencher detalhes faltantes e converter a sequéncia numa 
historia coerente. Nao podemos ter certeza de nossa 
experi€ncia consciente original apenas com base na 
rememoracao que fazemos dela, mas a memoria é 0 Unico 
acesso que temos a essa experiéncia. O momento presente é 
fugaz, digamos, e se transforma rapidamente numa 
memoria, ou, Como é€ mais comum, nao o faz. Mesmo que 
uma experiéncia se torne uma memoria, ela _ fica 
armazenada, como indica a TMRP, como um padrao de alto 
nivel composto de outros padroes, numa grande hierarquia. 
Como disse diversas vezes, quase todas as experiéncias que 
temos (como qualquer das ocasides em que trocamos de 
faixas) sao esquecidas imediatamente. Por isso, descobrir o 
que constitui nossa prdpria experi€ncia consciente nao é 
viavel na pratica. 


Oriente é Oriente e Ocidente 6 Ocidente 


Antes dos cérebros, nao existia cor ou som no universo, nem 
Sabores ou aromas, provavelmente poucos sentidos, nenhum 
sentimento ou emocao. 

- Roger W. Sperry [7] 


René Descartes entra num restaurante e se senta para jantar. 
O gargom aparece e pergunta se ele gostaria de um tira-gosto. 
“Nao, obrigado”, diz Descartes. “S6 quero pedir o jantar.” 
“Gostaria de saber qual é 0 prato do dia?”, pergunta 0 garcom. 
“Nao”, diz Descartes, um tanto impaciente. 
“Gostaria de um drinque antes do jantar?”, pergunta 0 garcom. 
Descartes se sente insultado, pois é abstémio. “Creio que ndo!”, 
diz indignado, desaparecendo num PUF! 
- Uma piada contada por David Chalmers 


Ha duas maneiras de analisar as questOes de que estivemos 
tratando: perspectivas ocidentais e orientais contrarias 
sobre a natureza da consciéncia e da realidade. Segundo a 
perspectiva ocidental, comecamos com um mundo fisico que 
envolve padroes de informacao. Apdés alguns bilhdes de anos 
de evolucao, as entidades desse mundo evoluiram o 
suficiente para se tornarem seres conscientes. Na visao 
oriental, a consciéncia € a realidade fundamental; o mundo 
fisico sO ganha existéncia através dos pensamentos de seres 
conscientes. Naturalmente, estas sao simplificacoes de 
filosofias complexas e variadas, mas representam as 
principais polaridades nas filosofias da consciéncia e de seu 
relacionamento com o mundo fisico. 

A divisao Oriente-Ocidente sobre a questao da 
consciéncia também ganhou expressao em escolas de 
pensamento opostas sobre a questao da fisica subatémica. 
Na mecanica quantica, as particulas existem como campos 
de probabilidade, como sao chamados. Qualquer medida 
realizada sobre elas por um aparelho de medicao causa o 
que se tem chamado de colapso da funcao de onda, o que 
significa que a particula assume subitamente uma 
localizacao especifica. Uma visao popular é que tal medicao 
pode ser a observacao por um observador consciente, ou do 
contrario a medicao seria um conceito sem significado. Logo, 
a particula assume uma localizacgao especifica (bem como 
outras propriedades, como velocidade) sO quando 6 
observada. Basicamente, as particulas descobrem que se 
ninguém se da ao trabalho de olhar para elas, elas nao 
precisam decidir aonde vao. Chamo isso de escola budista 
da mecanica quantica, pois nela as particulas simplesmente 
nao existem enquanto nao forem observadas por uma 
pessoa consciente. 


Existe outra interpretacao da mecanica quantica que 
evita a terminologia antropomérfica. Nessa analise, o campo 
que representa uma particula nao @€ um campo de 
probabilidades, mas apenas uma fungao com _ valores 
diferentes em locais diferentes. O campo, portanto, é 
fundamentalmente aquilo que a particula é. Ha limites 
quanto aos valores do campo em locais diferentes, pois todo 
O campo representando uma particula representa apenas 
uma quantidade limitada de informacées. E daf que vem a 
palavra “quantum”. O chamado colapso da funcao de onda, 
conforme esta visao, nao € um colapso. Na verdade, a 
funcao de onda nunca desaparece. E que um aparelho de 
medicao também é feito de particulas com campos, e a 
interag¢ao do campo de particulas sendo medido e os campos 
de particulas do aparelho de medicao resultam numa leitura 
pela qual a particula esta num local especifico. O campo, 
porém, ainda esta presente. Essa é a interpretacao ocidental 
da mecanica quantica, embora seja interessante notar que a 
visao mais popular entre fisicos do mundo inteiro é aquela 
que chamo de interpretacao oriental. 

Houve um fildsofo cujo trabalho cobriu essa divisao 
Oriente-Ocidente. O pensador austro-britanico Ludwig 
Wittgenstein (1889-1951) estudou a filosofia da linguagem 
e do conhecimento e pensou na questao sobre o que 
realmente podemos conhecer. Ele ponderou sobre o tema 
enquanto combatia na Primeira Guerra Mundial e fez 
anotacdes para aquele que seria seu Unico livro publicado 
em vida, Tractatus Logico-Philosophicus. A obra tinha uma 
estrutura incomum, e so gracas aos esforcos de seu antigo 
instrutor, o matematico e fildsofo inglés Bertrand Russell, foi 
que ele encontrou um editor em 1921. Esse livro se tornou a 
biblia de uma importante escola de filosofia conhecida como 


positivismo ldédgico, que procurou definir os limites da 
ciéncia. O livro e o movimento que o rodeou influenciaram 
Turing @ oO surgimento da teoria da computacao e da 
linguistica. 

O Tractatus Logico-Philosophicus antecipa a percepcao de 
que todo conhecimento é intrinsecamente hierarquico. O 
proprio livro € organizado em proposicoes encadeadas e 
numeradas. Por exemplo, as quatro proposicoes iniciais do 


livro sao: 


1 O mundo é tudo que € 0 caso. 

1.1 O mundo é a totalidade dos fatos, nao das coisas. 

1.11 O mundo é determinado pelos fatos, e por serem todos os 
fatos. 

1.12 Pois a totalidade dos fatos determina o que 6 0 caso e também 
tudo que nao € 0 caso. 


Outra proposicao importante no Tractatus - a qual Turing 
faria eco - 6 a Seguinte: 


4.0031 Toda filosofia € uma critica da linguagem. 


Essencialmente, tanto o Tractatus Logico-Philosophicus 
como o movimento do positivismo légico afirmam que a 
realidade fisica existe separadamente da percepcao que 
temos dela, mas que tudo que podemos saber sobre essa 
realidade 6 aquilo que percebemos com nossos sentidos - 
que pode ser aprimorado através de nossas ferramentas - e 
as inferéncias Iégicas que podemos extrair dessas 
impressOes sensoriais. Essencialmente, Wittgenstein esta 
tentando descrever os métodos e as metas da ciéncia. A 
proposicao final do livro € a de numero 7: “Sobre aquilo de 
que nao se pode falar, deve-se calar”. Coerentemente, no 
comeco Wittgenstein considera que a discussao sobre a 


consciéncia é circular e tautolégica, e portanto uma perda 
de tempo. 

Posteriormente, porém, Wittgenstein rejeitou por 
completo essa postura e dedicou toda a sua atencao 
filosdfica a falar de questdes que antes ele acreditava que 
deviam ser alvo do siléncio. Seus textos sobre esse 
pensamento revisado foram reunidos e publicados em 1953, 
dois anos apos sua morte, num livro chamado /nvestigacées 
filosoficas. Ele criticou suas ideias anteriores do Tractatus, 
considerando-as circulares e despidas de significado, e 
passou a acreditar que aquilo que considerara alvo de 
sil€ncio era, na verdade, tudo sobre o que se deveria refletir. 
Esses textos influenciaram fortemente os existencialistas, 
tornando Wittgenstein a unica figura da filosofia moderna a 
ser um grande arquiteto de duas importantes e 
contraditorias escolas de pensamento filos6fico. 

E o que Wittgenstein considerou, mais tarde, digno de ser 
pensado e falado? Foram questoes como beleza e amor, que 
ele percebeu que existiam de forma imperfeita como ideias 
nas mentes dos homens. Todavia, ele escreve que tais 
conceitos existem num ambito perfeito e idealizado, similar 
as “formas” perfeitas de que Platao tratou em seus dialogos, 
outra obra que lancou luzes sobre abordagens 
aparentemente contradit6érias sobre a natureza da realidade. 

Um pensador cuja posicao tem sido mal caracterizada, na 
minha opiniao, é o fildsofo e matematico francés René 
Descartes. Sua famosa proposicao “Penso, logo existo” 
costuma ser interpretada como um louvor ao pensamento 
racional, no sentido de “Penso, ou seja, consigo realizar um 
pensamento ldgico, portanto sou digno”. Assim, Descartes 
foi considerado o arquiteto da_perspectiva  racional 
ocidental. 


Mas ao ler essa proposicao no contexto de seus outros 
textos, fiquei com uma impressao diferente. Descartes 
estava intrigado com aquele que € chamado de “problema 
mente-corpo”: como uma mente consciente surge da 
matéria fisica do cérebro? Nessa perspectiva, parece que ele 
estava tentando levar o ceticismo racional até o ponto de 
ruptura, e por isso, em minha opiniao, 0 que sua proposicao 
realmente queria dizer era: “Penso, ou seja, esta 
acontecendo uma experiéncia subjetiva, portanto tudo que 
Sabemos ao certo é€ que alguma coisa - chame-a de eu - 
existe”. Talvez ele nao tivesse certeza da existéncia do 
mundo fisico, pois tudo 0 que temos sao nossas impressdes 
sensoriais e individuais sobre ele, que podem estar erradas 
ou ser completamente ilusdérias. Sabemos, no entanto, que o 
experimentador existe. 

Minha formacao religiosa foi numa igreja unitarista, onde 
estudamos todas as religides do mundo. Passavamos seis 
meses vendo o budismo, digamos, e depois frequentavamos 
servicos budistas, lfamos seus livros e mantinhamos 
discussodes em grupo com seus lideres. Depois, passavamos 
para outra religiao, como o judaismo. O tema principal era 
“muitos caminhos até a verdade”, juntamente com 
tolerancia e transcendéncia. Esta ultima ideia significa que 
conciliar contradic6es aparentes entre tradi¢des nao nos 
obriga a decidir que uma esta certa e a outra, errada. A 
verdade sO pode ser descoberta encontrando-se uma 
explicag¢ao que se sobrepde - transcende - as aparentes 
diferencas, especialmente em questoes fundamentais sobre 
significado e propésito. 

Foi assim que resolvi a divisao entre Ocidente e Oriente 
no que tange a consciéncia e ao mundo fisico. Acredito que 
as duas perspectivas tém de ser verdadeiras. 


Por um lado, é tolice negar o mundo fisico. Mesmo que 
vivamos numa simulacgao, conforme especulou o filésofo 
sueco Nick Bostrom, ainda assim a realidade 6 um nivel 
conceitual verdadeiro para nos. Se aceitarmos a existéncia 
do mundo fisico e a evolugao que tem ocorrido nele, 
podemos ver que entidades conscientes evoluiram a partir 
dele. 

Por outro lado, a perspectiva oriental - a de que a 
consciéncia é€ fundamental e representa a Unica realidade 
verdadeiramente importante - também é dificil de negar. 
Basta levar em conta a preciosa consideragao que damos a 
pessoas conscientes versus coisas _ inconscientes. 
Consideramos que essas ultimas nao tém valor intrinseco, 
exceto pelo fato de poderem influenciar a experiéncia 
subjetiva das pessoas conscientes. Mesmo se considerarmos 
a consciéncia uma propriedade emergente de um sistema 
complexo, nao podemos adotar a posicao de que ela 
apenas outro atributo (juntamente com a “digestao” e 
“lactagao”, para citar John Searle). Ela representa o que 
verdadeiramente importante. 

A palavra “espiritual” costuma ser usada para denotar as 
coisas que sao da maior significancia. Muita gente nao gosta 
de usar a terminologia de tradic6es espirituais ou religiosas 
porque ela implica conjuntos de crengas que as pessoas 
talvez nao adotem. Mas, se despirmos as complexidades 
misticas das tradicdes' religiosas e simplesmente 
respeitarmos “espiritual” como uma palavra que implica 
algo de significado profundo para os humanos, entao o 
conceito da consciéncia se encaixa bem nela. Ela reflete o 
mais elevado valor espiritual. De fato, a prdpria palavra 
“aspirito” costuma ser usada para denotar a consciéncia. 


OM. WY (OD, 


Portanto, a evolucao pode ser vista como um processo 
espiritual na medida em que cria seres espirituais, Ou seja, 
entidades conscientes. A evolucao também se move na 
direg¢ao de maior complexidade, de um conhecimento maior, 
uma inteligéncia maior, mais beleza, mais criatividade, e da 
Capacidade de expressar emocgoes mais transcendentes, 
como o amor. Todas sao descrigdes usadas pelas pessoas 
para o conceito de Deus, embora Deus seja descrito como 
ilimitado nesses ambitos. 

As pessoas costumam se_ sentir ameacadas_ por 
discuss6es que implicam a_ possibilidade de que uma 
maquina possa ter consciéncia, pois elas acham que esse 
tipo de consideracgao denigre o valor espiritual das pessoas 
conscientes. Mas essa reacao reflete uma compreensao 
err6nea do conceito de maquina. Esses criticos estao lidando 
com o assunto com base nas maquinas que eles conhecem 
hoje, e, embora sejam impressionantes, concordo que os 
exemplos contemporaneos de tecnologia ainda nao sao 
dignos de nosso respeito como seres conscientes. Minha 
previsao @ que elas vao se tornar indistinguiveis de 
humanos' biolédgicos, que consideramos como_ seres 
conscientes, e vao compartilhar, portanto, o valor espiritual 
que atribuimos a consciéncia. Isso nao desprestigia as 
pessoas; € uma elevacao de nossa compreensao de 
(algumas) maquinas futuras. Talvez devéssemos adotar uma 
terminologia diferente para essas entidades, pois elas serao 
um tipo diferente de maquina. 

Com efeito, ao olharmos hoje para o cérebro e 
decodificarmos seus mecanismos, descobrimos métodos e 
algoritmos que nao apenas podemos compreender, mas 
recriar - “as partes de um moinho empurrando-se umas as 
outras”, parafraseando o matematico e filédsofo alemao 


Gottfried Wilhelm Leibniz (1646-1716) quando escreveu 
sobre o cérebro. Os humanos ja sao maquinas espirituais. 
Ademais, vamos nos fundir tao intimamente com as 
ferramentas que estamos criando que a disting¢ao entre 
humano e maquina vai esmaecer até desaparecer a 
diferenca. Esse processo ja esta em andamento, embora a 
maioria das maquinas que nos servem de extensao ainda 
nao fique dentro de nosso corpo e cérebro. 


Livre-arbitrio 


Um aspecto central da consciéncia é€ a capacidade de olhar para a 
frente, a habilidade que chamamos de “antevisao”. E a capacidade 
de planejar, e, em termos sociais, de tracar um cenario daquilo que 
deve acontecer, ou pode acontecer, em interacgdes sociais que ainda 
nao aconteceram. [...] E um sistema pelo qual aumentamos a 
chance de fazer as coisas que vao representar nossos melhores 
interesses. [...] Sugiro que o “livre-arbitrio” seria nossa capacidade 
aparente de escolher e por em pratica aquilo que nos parece mais 
util ou apropriado, e nossa insisténcia em achar que tais escolhas 
sao nossas. 

- Richard D. Alexander 


Devemos dizer que a planta nao sabe o que esta fazendo 
simplesmente por nao possuir olhos, ou ouvidos, ou cérebro? Se 
dissermos que ela age mecanicamente, e apenas mecanicamente, 
nao seremos forgcados a admitir que muitas outras acoes, 
aparentemente muito deliberadas, também sao mecanicas? Se nos 
parece que a planta mata e come uma mosca mecanicamente, nao 
pode parecer para a planta que um homem deve matar e comer 
uma ovelha mecanicamente? 

- Samuel Butler, 1871 


Sera o cérebro, cuja estrutura € notadamente dupla, um 6rgao 
duplo, “aparentemente partido, mas ainda numa uniao nessa 
particao”? 


- Henry Maudsley [8] 


Como aprendemos, a redundancia @€ uma _ estratégia 
importante adotada pelo neocdrtex. Mas ha outro nivel de 
redundancia no cérebro, pois seus hemisférios esquerdo e 
direito, embora nao sejam idénticos, sao muito semelhantes. 
Assim como. certas regides do  neocdrtex acabam 
processando certos tipos de informacao, os hemisférios 
também se especializam até certo ponto; por exemplo, o 
hemisfério esquerdo é tipicamente responsavel pela 
linguagem verbal. Mas essas atribuicoes podem _ ser 
retracadas, a ponto de podermos sobreviver e funcionar de 
maneira razoavelmente normal apenas com uma metade. As 
pesquisadoras norte-americanas de neuropsicologia Stella 
de Bode e Susan Curtiss apresentaram um trabalho sobre 49 
criangas que foram submetidas a uma hemisferectomia 
(remocao de metade do cérebro), uma operacao extrema 
realizada em pacientes com um disturbio convulsivo, com 
perigo de morte, que so existe num hemisfério. Algumas das 
pessoas que se submetem a cirurgia ficam com deficiéncias, 
mas essas deficiéncias sao especificas e os pacientes tém 
uma personalidade razoavelmente normal. Muitos deles 
ficam bem, e os observadores nao percebem que eles tém 
apenas metade do cérebro. De Bode e Curtiss escreveram 
sobre criancgas que sofreram a hemisferectomia esquerda e 
que “desenvolveram uma linguagem notavelmente boa, 
apesar da remocao do hemisfério da ‘linguagem [9]’”. Elas 
contam que um desses estudantes concluiu o colegial, 
frequentou a faculdade e teve resultados acima da média 
em testes de QI. Estudos mostraram efeitos minimos no 
longo prazo sobre sua cognicao geral, memoria, 
personalidade e senso de humor [10]. Num estudo de 2007, 


os pesquisadores norte-americanos Shearwood McClelland e 
Robert Maxwell mostraram resultados positivos de longo 
prazo similares em adultos [11]. 

Os relatos sobre uma menina alema de 10 anos que 
nasceu com apenas metade do cérebro mostram-na como 
normal. Ela tem visao quase perfeita num dos olhos, apesar 
de pacientes de hemisferectomia perderem parte de seu 
campo de visao logo apoés a operacao [12]. O pesquisador 
escocés Lars Muckli comentou: “O cérebro tem uma 
plasticidade espantosa, mas ficamos at6énitos ao ver como 
foi boa a adaptacao do Unico hemisfério do cérebro dessa 
menina para compensar a metade faltante”. 

Embora essas observacoes apoiem claramente a ideia da 
plasticidade do neocdrtex, sua implicagao mais interessante 
€ que parece que temos dois cérebros, nao apenas um, e 
que podemos nos sair muito bem com qualquer um deles. Se 
perdemos um, perdemos os padroes corticais que so estao 
armazenados ali, mas cada cérebro é€ razoavelmente 
completo em si mesmo. Assim, sera que cada hemisfério tem 
Sua propria consciéncia? Ha um argumento a favor desse 
caso. Veja os pacientes com cérebros partidos, que ainda 
possuem ambos os hemisférios cerebrais, maS com o canal 
entre eles cortado. O corpo caloso 6 um feixe com cerca de 
250 milhOes de axdnios que conecta os hemisférios 
cerebrais esquerdo e direito, permitindo que se comuniquem 
e se coordenem um com o outro. Assim como duas pessoas 
podem se comunicar de perto e agir como um Unico tomador 
de decisdes, embora sejam individuos separados e integros, 
os dois hemisférios cerebrais podem funcionar como uma 
unidade, mantendo-se independentes. 

Como o termo implica, em pacientes com cérebros 
partidos o corpo caloso foi cortado ou danificado, deixando- 


os efetivamente com dois cérebros funcionais sem um 
vinculo direto de comunicacao entre eles. O pesquisador de 
psicologia norte-americano Michael Gazzaniga (nascido em 
1939) realizou diversos experimentos sobre aquilo que cada 
hemisfério em pacientes com cérebros partidos esta 
pensando. 

Geralmente, o hemisfério esquerdo de um paciente com 
cérebro partido vé o campo visual direito, e vice-versa. 
Gazzaniga e seus colegas mostraram a um paciente com 
cérebro partido a figura de um pé de galinha para o campo 
visual direito (que foi vista por seu hemisfério esquerdo) e 
uma cena de neve para 0 campo visual esquerdo (que foi 
vista por seu hemisfério direito). Depois, ele mostrou uma 
colecao de imagens para que os dois hemisférios as 
pudessem ver. Ele pediu para o paciente escolher uma 
imagem que se harmonizasse com a primeira imagem. A 
mao esquerda do paciente (controlada por seu hemisfério 
direito) apontou para a imagem de uma pa, enquanto a mao 
direita apontou para a imagem de uma galinha. Até aqui, 
tudo bem - os dois hemisférios estavam atuando de forma 
independente e sensata. “Por que vocé escolheu isso?”, 
Gazzaniga perguntou ao paciente, que _ respondeu 
verbalmente (sob o controle do centro de fala do hemisfério 
esquerdo): “Obviamente, o pé de galinha combina com a 
galinha”. Mas depois o paciente olhou para baixo e, 
percebendo que sua mao esquerda estava apontando para a 
pa, explicou o fato imediatamente (mais uma vez, com o 
centro de fala controlado pelo hemisfério esquerdo) dizendo 
“. @ vocé precisa de uma pa para limpar a sujeira da 
galinha”. 

Isso foi uma confabulacao. O hemisfério direito (que 
controla a mao e o braco esquerdos) apontou corretamente 


para a pa, mas como o hemisfério esquerdo (que controla a 
resposta verbal) nao tem consciéncia da neve, ele confabula 
uma explicacao, sem perceber que esta confabulando. Ele 
esta assumindo a responsabilidade por uma medida que 
nunca decidiu tomar e nunca tomou, mas acha que 0 fez. 

Isso implica que cada um dos dois hemisférios num 
paciente com cérebro partido tem sua propria consciéncia. 
Aparentemente, os hemisférios nao percebem que seu corpo 
€ controlado efetivamente por dois cérebros, porque eles 
aprendem a se coordenar mutuamente e suas decisoes sao 
suficientemente alinhadas e consistentes, de modo que 
cada um pensa que as decisodes do outro sao as suas 
proprias. 

O experimento de Gazzaniga nao prova que um individuo 
normal com um corpo caloso operacional tem duas metades 
cerebrais conscientes, mas sugere essa_ possibilidade. 
Embora o corpo caloso permita uma colaboracao eficiente 
entre as duas metades cerebrais, isso nao_ significa 
necessariamente que nao sao mentes separadas. Cada uma 
pode ser enganada a ponto de pensar que tomou todas as 
decisdes, pois elas seriam muito semelhantes as que cada 
metade tomaria por conta propria, e, afinal, cada uma 
exerce muita influéncia em cada decisao (colaborando com 
o outro hemisfério através do corpo caloso). Assim, para 
cada uma das duas mentes, a impressao é que ela tem o 
controle. 

Como podemos testar a conjectura de que ambos estao 
conscientes? Podemos_ avalia-los buscando correlatos 
neurol6gicos da consciéncia, que foi exatamente o que 
Gazzaniga fez. Seus experimentos mostram que cada 
hemisfério esta atuando como um cérebro independente. A 
confabulacao nao se limita aos hemisférios cerebrais; nds 


fazemos isso regularmente. Cada hemisfério é praticamente 
tao inteligente quanto um humano; logo, se acreditamos 
que um cérebro humano € consciente, entao temos de 
concluir que cada hemisfério é€ independentemente 
consciente. Podemos avaliar os correlatos neurolégicos e 
podemos realizar nossos proprios experimentos mentais 
(considerando, por exemplo, que se dois hemisférios 
cerebrais sem um corpo caloso funcional constituem duas 
mentes conscientes e separadas, entao o mesmo teria de ser 
verdadeiro para dois hemisférios sem uma _ conexao 
funcional entre eles), mas qualquer tentativa de uma 
deteccao mais direta da consciéncia em cada hemisfério 
pde-nos novamente diante da falta de um teste cientifico 
para a consciéncia. Mas, se aceitarmos que cada hemisfério 
cerebral € consciente, podemos garantir que a chamada 
atividade inconsciente do neocértex (que constitui a maior 
parte de sua atividade) também tem uma consciéncia 
independente? Ou sera que tem mais do que uma? Com 
efeito, Marvin Minsky se refere ao cérebro como uma 
“sociedade da mente [13]”. 

Noutro experimento com _ cérebros’- partidos, os 
pesquisadores mostraram a palavra “sino” para o hemisfério 
direito e “musica” para o hemisfério esquerdo. Pediram ao 
paciente para dizer que palavra ele viu. O centro da fala, 
controlado pelo hemisfério esquerdo, diz “musica”. Depois, o 
sujeito viu um grupo de imagens e |he pediram para apontar 
para a imagem que mais se aproximava da palavra que ele 
acabara de ver. Seu braco, controlado pelo hemisfério 
cerebral direito, apontou para o- sino. Quando lhe 
perguntaram por que ele apontara para o sino, o centro da 
fala, controlado pelo hemisfério esquerdo, respondeu: “Bem, 
musica, a ultima vez que ouvi uma musica foi a dos sinos 


badalando aqui perto”. Ele apresentou essa explicacao 
apesar de haver outras imagens que ele poderia ter 
escolhido e que se relacionavam muito mais de perto com a 
musica. 

Novamente, temos uma _ confabulacao. O hemisfério 
esquerdo esta explicando, como se fosse sua, uma decisao 
que ele nunca tomou e nunca levou a cabo. Ele nao esta 
fazendo isso para acobertar um amigo (ou seja, seu outro 
hemisfério); ele realmente pensa que a decisao foi sua. 

Essas reacdes e decisOes podem se estender as reacdes 
emocionais. Eles perguntaram a um paciente adolescente 
com cérebro partido, de tal modo que os dois hemisférios 
ouvissem: “Quem é@ a Sua preferida...” e depois passaram a 
palavra “namorada” sé para o hemisfério direito através do 
ouvido esquerdo. Gazzaniga conta que o paciente corou e 
reagiu envergonhado, uma reacao apropriada para um 
adolescente ao qual se pergunta algo sobre uma namorada. 
Mas o centro de fala, controlado pelo hemisfério esquerdo, 
informou que nao tinha ouvido nada e_ pediu 
esclarecimentos: “Minha preferida o qué?” Quando lhe 
pediram novamente para responder a pergunta, desta vez 
por escrito, a mao esquerda, controlada pelo hemisfério 
direito, escreveu 0 nome de sua namorada. 

Os testes de Gazzaniga nao sao experimentos mentais, 
mas verdadeiros experimentos com a mente. Embora 
oferecam uma perspectiva interessante sobre a questao da 
consciéncia, lidam ainda mais diretamente com a questao 
do livre-arbitrio. Em cada um desses casos, um dos 
hemisférios acreditou que tinha tomado uma decisao que, 
na verdade, nunca tomara. Até que ponto isso se aplica as 
decisOes que tomamos no nosso cotidiano? 


Veja o caso de uma paciente epiléptica de 10 anos de 
idade. O neurocirurgiao Itzhak Fried estava fazendo uma 
cirurgia cerebral enquanto ela estava acordada (0 que é 
viavel, uma vez que o cérebro nao tem receptores para a dor 
[14]). Sempre que ele estimulava um ponto especifico de 
seu neocortex, ela ria. No inicio, a equipe cirurgica pensou 
que eles podiam estar ativando algum tipo de reflexo de 
riso, mMaS nao demorou para perceberem que estavam 
acionando a propria percepcao do humor. Aparentemente, 
tinham encontrado um ponto de seu neocdrtex - e 
obviamente, ha mais do que um - que reconhece a 
percepcao do humor. Ela nao estava apenas rindo; na 
verdade, ela achava a situacao engracada, embora nada 
tivesse mudado na situacao, além de terem estimulado esse 
ponto de seu neocortex. Quando Ihe perguntaram por que 
ela estava rindo, ela nao respondeu nada do tipo “Ah, por 
nenhum motivo em particular”, ou “Vocé acabou de 
estimular meu cérebro”, mas confabulou imediatamente 
uma razao. Ela apontou para alguma coisa na sala e tentou 
explicar por que ela era engracada. “Vocés ficam tao 
gozados ai em pé”, foi outro comentario. 

Aparentemente, ficamos muito ansiosos para explicar e 
racionalizar nossas agoes, mesmo quando nao tomamos 
efetivamente as decisoes que levaram a elas. Assim, qual a 
responsabilidade que temos por nossas decisoes? Analise os 
experimentos realizados pelo professor de_  fisiologia 
Benjamin Libet (1916-2007) na Universidade da Califérnia 
em Davis. Libet fez com que os participantes se sentassem 
diante de um reldégio com eletrodos de EEG conectados ao 
couro cabeludo. Ele os instruiu a realizar tarefas simples, 
como apertar um botao ou mover um dedo. E pediu aos 
participantes para anotar o horario do relégio em que “se 


deram conta do desejo ou do impulso para agir”. Os testes 
indicaram uma margem de erro de apenas 50 milissegundos 
nessas avaliacdes feitas pelos sujeitos. Eles também 
mediram uma média de 200 milissegundos entre 0 momento 
em que os sujeitos informaram ter percebido o impulso de 
agire a acao em si [15]. 

Os pesquisadores também analisaram os sinais de EEG 
provenientes do cérebro dos sujeitos. A atividade cerebral 
envolvida no inicio da acao pelo cértex motor (responsavel 
pela realiza¢ao da acao) ocorreu. na verdade 500 
milissegundos, em média, antes da realizacao da acao. Isso 
significa que o cdértex motor estava se preparando para 
realizar a tarefa cerca de um terco de segundo antes de o 
sujeito sequer perceber que decidira realiza-la. 

As implicagoes dos experimentos de Libet foram alvo de 
discusses acaloradas. O proprio Libet concluiu que nossa 
percepcao da tomada de decisao parece ser uma ilusao, que 
a “consciéncia esta fora do elo”. O fildsofo Daniel Dennett 
comentou: “A acao se precipitou originariamente em alguma 
parte do cérebro, e os sinais voaram até os musculos, 
fazendo uma pausa no caminho para dizer a vocé, 0 agente 
consciente, o que esta acontecendo (mas, como todo bom 
subalterno, fazendo com que vocé, o trépego presidente, 
mantenha a ilusao de que foi vocé que deu inicio a tudo 
[16])”. Ao mesmo tempo, Dennett questionou os tempos 
registrados pelo experimento, argumentando basicamente 
que os sujeitos talvez nao tenham ciéncia do momento em 
que ficaram cientes da decisao de agir. O que nos leva a 
perguntar: se o sujeito nao tem ciéncia de quando ele esta 
ciente de que vai tomar uma decisao, entao, quem tem? Mas 
o ponto foi bem levantado; como disse antes, aquilo de que 
temos consciéncia nao esta nem um pouco claro. 


O neurocientista indo-americano Vilayanur Subramanian 
“Rama” Ramachandran (nascido em 1951) explica a 
situacao de forma um pouco diferente. Tendo em vista que 
temos cerca de 30 bilhdes de neurdnios no neocortex, ha 
sempre muita coisa acontecendo la, e estamos conscientes 
de uma parcela bem pequena disso. Decis6es, grandes e 
pequenas, estao constantemente sendo processadas pelo 
neocortex, e solucdes propostas sobem até nossa percepcao 
consciente. Em vez do livre-arbitrio, Ramachandran sugere 
que falemos do “livre nao”, ou seja, o poder de rejeitar 
solugdes propostas pelas partes nao conscientes de nosso 
neocortex. 

Pense na analogia com uma campanha militar. Os oficiais 
do exército preparam uma recomendacao para o presidente. 
Antes de receberem a aprovacao do presidente, eles fazem 
um trabalho preparatério que lhes permitira por em pratica a 
decisao. Num dado momento, a decisao proposta é4 
apresentada ao presidente, que a aprova, e o resto da 
missao € levado a cabo. Como o “cérebro” representado por 
essa analogia envolve os processos inconscientes do 
neocortex (ou seja, os oficiais abaixo do presidente), bem 
como seus processos conscientes (o presidente), veriamos a 
atividade neural bem como acoes efetivas acontecendo 
antes que a decisao oficial seja tomada. Sempre podemos 
discutir a margem que os oficiais deram de fato ao 
presidente para aceitar ou rejeitar uma recomendacao numa 
situacao especifica, e certamente os presidentes americanos 
fizeram as duas coisas. Mas nao deve nos surpreender o fato 
de a atividade mental, mesmo no cortex motor, comecar 
antes de termos ciéncia de que havia uma decisao a se 
tomar. 


O que os experimentos de Libet conseguem enfatizar é 
que existe muita atividade em nosso cérebro, por tras de 
nossas decisoOes, que nao é€ consciente. Ja sabemos que a 
maior parte do que acontece no neocortex nao é consciente; 
nao nos deveria surpreender, portanto, que nossas acodes e 
decisOes derivem tanto de atividades conscientes como 
inconscientes. Essa diferenca importa? Se nossas decisoes 
provém de ambas, importa se _ ffiltramos as_ partes 
conscientes das inconscientes? Os dois aspectos nao 
representam nosso cérebro? Nao somos, em ultima analise, 
responsaveis por tudo aquilo que acontece em nosso 
cérebro? “Sim, atirei na vitima, mas nao sou responsavel 
porque eu nao estava prestando atencao” é sem duvida uma 
defesa bem fraca. Apesar de haver alguma ténue base legal 
segundo a qual a pessoa nao @€ responsavel por suas 
decisoes, de modo geral somos responsaveis por todas as 
escolhas que fazemos. 

As observagoes e os experimentos que citei acima 
constituem experimentos mentais sobre a questao do livre- 
arbitrio, um assunto que, como o tdpico da consciéncia, tem 
sido discutido desde Platao. A prdpria expressao “livre- 
arbitrio” data do século 13, mas qual é o seu significado 
exato? 

O dicionario Merriam-Webster a define como “a liberdade 
que tém os humanos de fazer escolhas que nao sao 
determinadas por causas anteriores ou pela intervencao 
divina”. Vocé percebe que essa_ definicao 4 
irremediavelmente circular: “Livre-arbitrio 6 a liberdade...” 
Deixando de lado a ideia da intervencao divina em oposicao 
ao livre-arbitrio, so ha um elemento util nessa definicao, que 
€ a ideia de uma decisao “nao [ser] determinada por causas 
anteriores”. Volto a isso num momento. 


A Stanford Encyclopedia of Philosophy afirma que livre- 
arbitrio € a “capacidade de agentes racionais escolherem 
um curso de acao dentre diversas alternativas”. Segundo 
essa definicao, um computador simples 6 capaz de livre- 
arbitrio, e por isso tal definicao € menos util que a do 
dicionario. 

A Wikipédia € um pouco melhor. Ela define o livre-arbitrio 
como “a capacidade de um agente fazer escolhas livre de 
certos tipos de restricao. [...] A restri¢ao que mais preocupa 
tem sido [...] o determinismo”. Novamente, ela usa a palavra 
circular “livre” na definicao do livre-arbitrio, mas expressa 
aquilo que foi considerado o principal inimigo do livre- 
arbitrio: o determinismo. Nesse sentido, a definicao do 
Merriam-Webster dada acima €, com efeito, similar em sua 
refer€ncia a decisoes que “nao sao determinadas por causas 
anteriores”. 

E o que quer dizer determinismo? Se eu digitar “2 + 2” 
numa calculadora e ela exibir “4”, posso dizer que a 
calculadora exibiu seu livre-arbitrio decidindo mostrar esse 
“4”? Ninguém aceitaria isso como uma demonstracao de 
livre-arbitrio, pois a “decisao” foi predeterminada pelos 
mecanismos internos da _ calculadora e pelos dados 
digitados. Se eu fizer uma conta mais complexa, ainda 
vamos chegar a mesma conclusao em relacao a sua falta de 
livre-arbitrio. 

E o que dizer de Watson quando ele responde a uma 
pergunta do /eopardy!? Embora suas deliberagoes sejam 
bem mais complexas que as da calculadora, poucos 
observadores, ou nenhum, atribuiria livre-arbitrio a suas 
decisOes. Nenhum humano conhece exatamente o 
funcionamento de todos os seus programas, mas podemos 
identificar um grupo de pessoas que, coletivamente, pode 


descrever todos os seus métodos. O mais importante 6 que 
seu output é determinado (1) por todos os seus programas 
no momento em que a pergunta é feita, (2) pela pergunta 
em si, (3) pelo estado de seus parametros internos que 
influenciam suas decisdes e (4) por seus trilhoes de bytes de 
base de conhecimento, inclusive enciclopédias. Com base 
nessas quatro categorias de informacao, seu output é 
determinado. Podemos especular que se apresentassemos a 
mesma pergunta, obteriamos sempre a mesma resposta, 
mas Watson foi programado para aprender com sua 
experiéncia; logo, ha a possibilidade de que as respostas 
subsequentes sejam diferentes. Contudo, isso nao contradiz 
esta analise; na verdade, constitui apenas uma mudanca no 
item 3, oS parametros que controlam suas decisoes. 

E como, exatamente, um ser humano difere de Watson, a 
ponto de atribuirmos livre-arbitrio ao humano, mas nao ao 
programa de computador? Podemos identificar varios 
fatores. Muito embora Watson jogue Jeopardy! melhor que a 
maioria dos humanos, ou que todos eles, ele nao € nem de 
longe tao complexo quanto um neocértex humano. Entao, a 
diferenca 6 apenas na escala de complexidade de seu 
pensamento hierarquico? Ha quem considere que o 
problema se reduz a isso. Em minha discussao sobre a 
questao da consciéncia, comentei que meu proprio salto de 
fé @ que eu consideraria consciente um computador que 
passasse por um teste de Turing valido. Os melhores 
chatbots nao conseguem fazer isso hoje (embora estejam 
melhorando cada vez mais), e€ por isso minha conclusao, 
com relacao a consciéncia, € uma questao do nivel de 
desempenho da entidade. Talvez 0 mesmo seja verdadeiro 
quanto ao fato de eu atribuir livre-arbitrio a ela. 


Com efeito, a consciéncia 6 uma diferenca filosdfica entre 
os cérebros humanos e os atuaisS programas de software. 
Consideramos os cérebros humanos conscientes, embora 
nao atribuamos isso - ainda - a programas de software. Sera 
esse o fator que estamos procurando por tras do livre- 
arbitrio? 

Um simples experimento mental apoiaria a ideia de que a 
consciéncia @, de fato, uma parte vital do livre-arbitrio. 
Pense numa situacao na qual alguém realiza uma acao sem 
a nocao de que a esta realizando: ela esta sendo realizada 
inteiramente por uma atividade nao consciente do cérebro 
dessa pessoa. Nos considerariamos isso uma demonstra¢cao 
de livre-arbitrio? A maioria das pessoas responderia que nao. 
Se a acgao causasse algum mal, _ provavelmente 
considerariamos a pessoa responsavel, mas procurariamos 
algumas acoes conscientes recentes que poderiam ter 
levado essa pessoa a realizar algumas acdes sem a 
percepcao consciente, como uma dose de bebida a mais, ou 
a mera falha no treinamento adequado para analisar 
conscientemente suas decisoOes antes de agir com base 
nelas. 

Segundo alguns comentaristas, os experimentos de Libet 
sao contrarios ao livre-arbitrio, pois mostram que boa parte 
das decisoes que tomamos nao sao conscientes. Como existe 
um razoavel consenso entre os fildsofos de que o livre- 
arbitrio implica uma tomada consciente de decisdes, parece 
que esta seria um pré-requisito para o livre-arbitrio. No 
entanto, para muitos observadores, a consciéncia € uma 
condicao necessaria, mas nao suficiente. Se nossas decisdes 
- conscientes ou nao - sao predeterminadas antes que as 
tomemos, como podemos dizer que nossas decisodes sao 
livres? Essa posicao, que sustenta que livre-arbitrio e 


determinismo nao sao compativeis, @ conhecida como 
incompatibilismo. Por exemplo, o fildsofo norte-americano 
Carl Ginet (nascido em 1932) argumenta que, se eventos no 
passado, no presente e no futuro sao determinados, entao 
podemos considerar que nao temos controle sobre eles ou 
suas consequéncias. Nossas decisdes e acgdes aparentes sao 
apenas parte dessa sequéncia predeterminada. Para Ginet, 
isso exclui o livre-arbitrio. 

Todavia, nem todos consideram o- determinismo 
incompativel com o  conceito de_ livre-arbitrio. Os 
compatibilistas argumentam, essencialmente, que vocé tem 
a liberdade para decidir aquilo que quer, mesmo que aquilo 
que vocé decide possa ser (ou seja) determinado. Daniel 
Dennett, por exemplo, alega que embora o futuro possa ser 
determinado pelo estado do presente, a realidade € que o 
mundo é tao intricadamente complexo que nao temos como 
saber o que o futuro trara. Podemos identificar aquilo a que 
ele se refere como “expectativas”, e temos, de fato, a 
liberdade para realizarmos atos que diferem dessas 
expectativas. Deveriamos levar em conta como nossas 
decisOes e€ acoes se comparam com essas expectativas, e 
nao com um futuro determinado teoricamente e que nao 
podemos conhecer de fato. Isso, conforme alega Dennett, é 
suficiente para o livre-arbitrio. 

Gazzaniga também expressa uma posicao compatibilista: 
“Somos agentes pessoalmente responsaveis e devemos 
responder por nossas acoes, embora vivamos num mundo 
determinado [17]”. Um cinico poderia interpretar essa visao 
como: vocé nao tem controle sobre suas acdes, mas mesmo 
assim vamos culpa-lo. 

Alguns pensadores descartam a ideia de livre-arbitrio 
como uma ilusao. O fildsofo escocés David Hume (1711- 


1776) descreveu-o como uma mera questao “verbal” 
caracterizada por “uma falsa sensacao ou aparéncia de 
experiéncia [18]”. O fildsofo alemao Arthur Schopenhauer 
(1788-1860) escreveu que “cada um se imagina a priori 
perfeitamente livre, mesmo em suas acoes individuais, e 
pensa que a cada momento pode comecar outra maneira de 
vida. [...] Mas a posteriori, pela experiéncia, descobre 
espantado que ele nao é livre, mas submisso a necessidade, 
que apesar de todas as suas resolucoes e reflexoes ele nao 
muda sua conduta, e que, desde 0 comeco de sua vida até o 
fim dela, ele deve levar a cabo o préprio personagem que 
ele mesmo condena[19]”. 

Eu acrescentaria diversos pontos. O conceito de livre- 
arbitrio - e de responsabilidade, uma ideia intimamente 
alinhada com ele - @€ util, até mesmo vital, para a 
manutencao da ordem social, quer o livre-arbitrio exista de 
fato, quer nao. Assim como a consciéncia existe claramente 
como um meme, existe o livre-arbitrio. Tentativas de provar 
Sua existéncia, ou mesmo de defini-la, podem se tornar 
irremediavelmente circulares, mas a realidade € que quase 
todos acreditam na ideia. Parcelas bastante substanciais de 
nosso neocortex de nivel superior sao dedicadas ao conceito 
de que fazemos escolhas livremente e somos responsaveis 
por nossas acdes. Se num sentido filosdfico estrito isso é 
verdade ou até mesmo possivel, a sociedade estaria bem 
pior se nao tivéssemos tais crencas. 

Ademais, 0 mundo nao é necessariamente determinado. 
Discuti antes duas perspectivas sobre a mecanica quantica 
que diferem quanto ao relacionamento entre os campos 
quanticos e o observador. Uma interpretacao popular da 
perspectiva baseada no observador proporciona um papel 
para a consciéncia: as particulas nao resolvem sua 


ambiguidade quantica enquanto nao sao observadas por um 
observador consciente. Existe outra cisao na filosofia dos 
eventos quanticos que tem relagao com a nossa diScussao 
sobre livre-arbitrio, uma ciSao que gira em torno desta 
questao: os eventos quanticos sao determinados ou 
aleat6érios? 

A interpretagao mais comum de um evento quantico é 
que quando a funcao de onda que constitui uma particula 
sofre um “colapso”, a localizacao da particula se especifica. 
Apés muitos e muitos desses eventos, havera uma 
distribuicao previsivel (motivo pelo qual a funcao de onda é 
considerada uma distribui¢ao de probabilidades), mas a 
resolucao para cada particula que sofre o colapso de sua 
funcao de onda é aleatdria. A interpretacao oposta é 
deterministica: especificamente, existiria uma variavel 
oculta que nao conseguimos detectar separadamente, mas 
cujo valor determina a posicao da particula. O valor ou fase 
da variavel oculta no momento do colapso da funcao de 
onda determina a posicao da particula. A maioria dos fisicos 
quanticos parece favorecer a ideia de uma_ resolucao 
aleatéria segundo o campo de _ probabilidade, mas as 
equacdes da mecanica quantica permitem a existéncia de 
tal variavel oculta. 

Logo, © mundo pode nao ser determinado, afinal. 
Segundo a interpretag¢ao da onda de probabilidades da 
mecanica quantica, existe uma fonte continua de incerteza 
no nivel mais basico da realidade. No entanto, essa 
observacgao nao resolve necessariamente as preocupacoes 
dos incompatibilistas. EE certo que, segundo essa 
interpretag¢ao da mecanica quantica, 0 mundo nao é 
determinado, mas nosso conceito de livre-arbitrio vai além 
de decis6es e acdes meramente aleatérias. A maioria dos 


incompatibilistas consideraria o conceito do livre-arbitrio 
incompativel também com a ideia de que nossas decisdes 
seriam essencialmente acidentais. O livre-arbitrio parece 
implicar tomadas de decisao voluntarias. 

O dr. Wolfram propde um modo para resolver o dilema. 
Seu livro A new kind of science (publicado em 2002) 
apresenta uma visSao abrangente da ideia de autédmatos 
celulares e de seu papel em cada faceta de nossas vidas. Um 
autOmato celular € um mecanismo no qual o valor das 
células de informacao é recalculado continuamente como 
funcao das células préximas. John von Neumann criou uma 
maquina tedrica e autorreplicante chamada_ construtor 
universal, que deve ter sido 0 primeiro aut6mato celular. 

O dr. Wolfram ilustra sua tese com os autématos celulares 
mais simples, um grupo de_ células numa _ linha 
unidimensional. A cada momento, cada célula tem um 
dentre dois valores: preto ou branco. O valor de cada célula 
€ recalculado para cada ciclo. O valor de uma célula para o 
ciclo seguinte é funcdao de seu valor atual, bem como o valor 
de seus dois vizinhos adjacentes. Cada aut6mato celular é 
caracterizado por uma regra que determina como se calcula 
se uma célula sera preta ou branca no ciclo seguinte. 

Vejamos o exemplo daquela que o dr. Wolfram chamou de 
regra 222. 


regra 222 
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As oito combinacdoes possiveis de valor para a célula 
sendo recalculada e para as vizinhas da esquerda e da 
direita aparecem na fileira de cima. Seu novo valor é 
mostrado na fileira de baixo. Assim, por exemplo, se a célula 
€ preta e as duas células vizinhas também sao pretas, entao 
a célula vai permanecer preta na geracao seguinte (veja a 
Sub-regra da regra 222 na extremidade esquerda). Se a 
célula é branca, a vizinha da esquerda também é brancaea 
da direita é preta, entao ela mudara e ficara preta na 
geracao seguinte (veja a sub-regra da regra 222 que éa 
segunda a contar da direita). 

O universo desse simples aut6émato celular 6 apenas uma 
fileira de células. Se comecamos com apenas uma célula 
preta no meio e mostramos a evolucao das células apos 
multiplas geracgdes (nas quais cada fileira inferior representa 
uma nova geracao de valores), os resultados da regra 222 
ficarao parecidos com isto: 


regra 222 





Um autémato se baseia numa regra, e a regra define se a 
célula sera preta ou branca com base no padrao existente na 


geracao atual dentre oito padroes possiveis. Logo, ha 28 = 
256 regras possiveis. O dr. Wolfram relacionou todos os 256 
autOmatos possiveis e lhes atribuiu um cddigo Wolfram 
entre 0 e 255. E interessante observar que essas 256 
maquinas tedricas t@ém propriedades muito diferentes. Os 
autOmatos que o dr. Wolfram chama de classe I, como a 
regra 222, criam padroes muito previsiveis. Se eu fosse 
perguntar o valor da célula do meio apdés um trilhao de 
trilhodes de iteracdes da regra 222, vocé poderia responder 
facilmente: preto. 

Muito mais interessantes, porém, sao os autOmatos da 
classe IV, ilustrados pela regra 110. 


regra 110 
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Multiplas geragdes destes aut6ématos se parecem com 
isto: 
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O que é interessante nos autOmatos da regra 110, e nos 
autOmatos da classe IV em geral, 6 que os resultados sao 
completamente imprevisiveis. Os resultados passam pelos 
mais severos testes matematicos de aleatoriedade, mas nao 
geram simplesmente ruido: sao padroes repetitivos, mas se 
repetem de maneira singular e imprevisivel. Se eu lhe 
perguntasse o valor de uma célula especifica apds um 
trilhao de trilhoOes de iteragdes, nao haveria como responder 
a essa pergunta sem fazer essa maquina produzir todas 
essas geracoes. A solucao é determinada com clareza, pois 
essa € uma maquina deterministica muito simples, mas é 
completamente imprevisivel sem fazer a maquina funcionar. 

A tese primaria do dr. Wolfram € que o mundo é€ um 
grande autdémato celular da classe IV. A razao pela qual seu 
livro tem como titulo A new kind of science é que essa teoria 
contrasta com a maioria das outras leis cientificas. Se existe 
um satélite orbitando a Terra, podemos prever onde ele 
estara daqui a cinco anos sem termos de percorrer cada 


momento de um _ processo simulado, usando as leis 
relevantes da gravitagcao e encontrando o lugar onde ele 
estara num momento futuro. Mas o estado futuro dos 
autOmatos celulares da classe IV nao pode ser previsto sem 
simular cada etapa do caminho. Se o universo € um 
gigantesco aut6mato celular, como postula o dr. Wolfram, 
nao haveria computador grande o suficiente - pois cada 
computador seria um subconjunto do universo - para rodar 
tal simulacao. Portanto, o estado futuro do universo nao 
pode ser conhecido, embora seja deterministico. 

Logo, apesar de nossas decisOes serem determinadas 
(pois Nnossos corpos e cérebros fazem parte de um universo 
deterministico), sao, ainda assim, inerentemente 
imprevisiveis, pois vivemos num autémato da classe IV (e 
fazemos parte dele). Nao podemos prever o futuro de um 
autOmato de classe IV, exceto deixando o futuro se 
desenvolver. Para o dr. Wolfram, isso é suficiente para se 
aceitar o livre-arbitrio. 

Nao precisamos observar o universo para ver eventos 
futuros determinados, mas imprevisiveis. Nenhum dos 
cientistas que trabalhou com o Watson pode prever o que 
ele fara, pois Oo programa é simplesmente complexo e 
variado demais, e seu desempenho se _ baseia em 
conhecimentos vastos demais para que qualquer ser 
humano possa domina-los. Se acreditarmos que os humanos 
exibem livre-arbitrio, entao o que decorre disso 6 que temos 
de aceitar que futuras versOes do Watson ou de maquinas 
semelhantes ao Watson também poderao exibi-lo. 

Meu proprio salto de fé é que acredito que os humanos 
tém livre-arbitrio, e, embora eu aja como se fosse esse oO 
caso, sinto dificuldades para encontrar, entre minhas 
proprias decisdées, exemplos que ilustrem isso. Pense na 


decisao de escrever este livro: eu nunca tomei essa decisao. 
Na verdade, a ideia do livro decidiu isso por mim. De modo 
geral, sinto-me cativo de ideias que parecem se implantar 
em meu neocortex, assumindo o comando. O que dizer da 
decisao de me casar, que tomei (em colaboragao com outra 
pessoa) ha 36 anos? Na @poca, eu estava seguindo o 
programa habitual de me sentir atraido por uma bela moca, 
e de ir atras dela. Entao, me apaixonei. Onde esta o livre- 
arbitrio nisso? 

E o que dizer das pequenas decisodes que tomo todos os 
dias, como as palavras especificas que decido usar para 
escrever meu livro? Comeco com uma folha virtual de papel 
em branco. Ninguém esta me dizendo o que fazer. Nao 
existe um editor olhando por cima do meu ombro. Minhas 
escolhas cabem totalmente a mim. Sou livre - totalmente 
livre - para escrever O que eu... 

Uh, grokar... 

Grokar? Certo, escrevi isso; finalmente, usei meu livre- 
arbitrio. Eu ia escrever a palavra “quiser”, mas tomei a 
decisao livre de escrever algo totalmente inesperado no 
lugar dela. Talvez esta seja a primeira vez em que tive 
sucesso no exercicio do livre-arbitrio mais puro. 

Ou nao. 

Deve ter ficado aparente que essa nao foi uma 
demonstracao da vontade, mas da tentativa de ilustrar meu 
ponto (e talvez uma exibicao de péssimo senso de humor). 

Embora eu compartilhe a confianca de Descartes quanto 
a minha consciéncia, nao tenho a mesma certeza quanto ao 
livre-arbitrio. E dificil escapar da  conclusao de 
Schopenhauer: “Vocé pode fazer o que quiser, mas num 
dado momento de sua vida vocé s6 pode querer uma coisa 
especifica e absolutamente nada além dessa coisa [20]”. 


Mesmo assim, continuo a agir como se tivesse livre-arbitrio e 
a acreditar nele, desde que nao tenha de explicar a razao. 


Identidade 


Certa vez, um fildsofo teve o seguinte sonho. 

Primeiro surgiu-lhe Aristdteles, e o fildsofo Ihe disse: “Vocé pode me 
fazer um esboco sintético de quinze minutos sobre toda a sua 
filosofia?” Para surpresa do fildsofo, Aristdteles fez uma excelente 
exposi¢ao, na qual comprimiu uma enorme quantidade de material 
em meros quinze minutos. Depois, porém, o fildsofo apresentou 
uma objecao para a qual Aristételes nao teve resposta. Confuso, 
Aristoteles desapareceu. 

Entao, apareceu Platao. A mesma coisa tornou a acontecer, e a 
objecao do fildsofo foi a mesma objecdao oposta a Aristdételes. Platao 
também nao conseguiu responder e desapareceu. 

Depois, todos os fildsofos famosos da historia apareceram, um por 
um, e nosso fildsofo apresentou a todos a mesma objecao. 

Depois que o Ultimo fildsofo desapareceu, nosso fildsofo disse para 
si mesmo: “Sei que estou dormindo e sonhando com tudo isso. Mas 
encontrei uma refutacdo universal para todos os sistemas filosdficos! 
Amanha, quando acordar, provavelmente eu a terei esquecido, e o 
mundo tera perdido algo excepcional!” Com esforco férreo, o fildsofo 
forgou-se a levantar, correu para sua escrivaninha e anotou sua 
refutagao universal. Depois, voltou para a cama com um suspiro de 
alivio. 

Na manha seguinte, ao acordar, correu até a escrivaninha para ver 
o que tinha escrito. Era: “Isso 6 0 que vocé diz”. 

- Raymond Smullyan, citado por David Chalmers [21] 


O que mais me intriga, até mais do que a duvida de ter ou 
nao consciéncia, ou de exercer ou nao o livre-arbitrio, 6 por 
que eu tenho consciéncia das experiéncias e das decisdes 
dessa pessoa especifica que escreve livros, gosta de 
caminhar e andar de_ bicicleta, toma suplementos 


alimentares e assim por diante. Uma resposta dbvia seria: 
“Porque vocé é essa pessoa”. 

Essa réplica nao deve ser mais tautolédgica do que as 
respostas apresentadas antes as questdes sobre consciéncia 
e livre-arbitrio. Mas, na verdade, tenho uma resposta melhor 
para Oo motivo pelo qual minha consciéncia esta associada 
com essa pessoa em particular: 6 porque foi como me criei 
para ser. 

Um aforismo comum é: “Vocé é 0 que vocé come”. E 
ainda mais verdadeiro dizer: “Vocé 6 0 que vocé pensa”. 
Como discutimos, todas as estruturas hierarquicas de meu 
neocortex que definem minha personalidade, habilidades e 
conhecimentos resultam de meus prdprios pensamentos e 
experiéncias. AS pessoas com quem escolho interagir, e as 
ideias e€ oS projetos a que me dedico, sao determinantes 
primarios daquilo que me torno. Por falar nisso, aquilo que 
como também reflete as decis6des tomadas por meu 
neocortex. Aceitando o lado positivo da dualidade do livre- 
arbitrio por enquanto, sao minhas prdprias decisdes que 
resultam naquilo que sou. 

Independentemente de como nos tornamos quem somos, 
cada um de nos tem o desejo de que nossa identidade 
persista. Se vocé nao tivesse a vontade de sobreviver, nao 
estaria aqui lendo este livro. Toda criatura tem essa meta; 
ela € o principal determinante da evolucao. A questao da 
identidade deve ser ainda mais dificil de definir do que a 
consciéncia ou o livre-arbitrio, mas provavelmente mais 
importante. Afinal, precisamos saber o que somos se 
desejamos preservar nossa existéncia. 

Analise 0 seguinte experimento mental: vocé esta no 
futuro com tecnologias mais avancadas do que as atuais. 
Enquanto dorme, um grupo faz a varredura de seu cérebro e 


capta todos os detalhes evidentes. Talvez eles fagam isso 
com maquinas de varredura do tamanho de _ células 
Sanguineas percorrendo os capilares de seu cérebro ou com 
alguma outra tecnologia nao invasiva adequada, mas eles 
tém todas as informacdes sobre seu cérebro num 
determinado momento do tempo. Eles também coletam e 
registram detalhes corporais que possam refletir o seu 
estado mental, como o sistema endécrino. Eles inserem esse 
“arquivo mental” num corpo nao bioldédgico que se parece 
com vocé e se movimenta como vocé, e que tem a Sutileza e 
a adaptabilidade necessarias para se passar por vocé. Pela 
manha, vocé é informado dessa transferéncia e observa 
(talvez sem ser notado) seu clone mental, a quem vamos 
chamar de Vocé 2. Vocé 2 esta falando da vida dele como se 
fosse vocé, contando que descobriu naquela manha que 
recebeu uma nova versao 2.0 com um corpo muito mais 
duravel. “Puxa, acho que gostei deste novo corpo!”, 
exclama. 

A primeira questao a se analisar 6: Vocé 2 tem 
consciéncia? Bem, certamente parece que sim. Ele passa 
pelo teste que comentei antes, pois tem os sinais sutis de 
uma pessoa consciente e dotada de sentimentos. Se vocé 
tem consciéncia, Vocé 2 também tem. 

Assim, se vocé, bem, desaparecesse, ninguém perceberia. 
Vocé 2 estaria por ai, alegando que é vocé. Todos os seus 
amigos e entes queridos ficariam felizes com a situagao e 
até satisfeitos por vocé ter um corpo e um substrato mental 
mais duraveis do que antes. Talvez seus amigos com 
propensao mais filosdfica expressem alguma preocupacao, 
mas, de modo geral, todos estariam felizes, inclusive vocé, 
ou, nO minimo, a pessoa que alega convincentemente ser 
voce. 


Assim, nao precisamos mais do seu velho corpo e de seu 
cérebro, nao &? Tudo bem se nos livrarmos dele? 

Provavelmente, vocé nao vai concordar com isso. Eu disse 
que a varredura nao foi invasiva, e por isso vocé ainda esta 
por ai, consciente. Além disso, seu senso de identidade 
ainda esta com vocé, e nao com Vocé 2, embora Vocé 2 
pense que é€ uma continuacao de vocé. Talvez Vocé 2 nem 
Saiba que vocé existe ou tenha existido. Na verdade, nem 
vocé teria ciéncia de que Vocé 2 existe se nao lhe 
tivéssemos contado. 

Nossa conclusao? Vocé 2 é consciente, mas 6 uma pessoa 
diferente de vocé; Vocé 2 tem uma identidade diferente. Ele 
é extremamente similar, muito mais do que um mero clone 
genético, porque ele também compartilha todos os seus 
padroes e conexoes neocorticais. Ou devo dizer que ele 
compartilhou esses padroes no momento em que foi criado. 
A partir dai, vocés dois comecaram a seguir seus prdprios 
rumos em termos neocorticais. Vocé ainda esta por ai. Vocé 
nao esta tendo as mesmas experiéncias que Vocé 2. Em 
Suma: Vocé 2 nao é vocé. 

Até aqui, tudo bem. Agora, analise outro experimento 
mental que, creio, € mais realista em termos daquilo que o 
futuro pode trazer. Vocé se submete a uma cCirurgia para 
substituir uma pequena parte de seu cérebro por uma 
unidade nao bioldgica. Vocé esta convencido de que € um 
procedimento seguro, e ha relatos que falam de diversos 
beneficios. 

Isso nao é tao despropositado, pois é feito rotineiramente 
em pessoas com problemas neuroldgicos e sensoriais, como 
o implante neural para o Mal de Parkinson e implantes 
cocleares para surdos. Nesses casos, oO- aparelho 


4 


computadorizado é€ colocado dentro do corpo mas fora do 


cérebro, embora ligado a este (ou, no caso dos implantes 
cocleares, ao nervo auditivo). Na minha opiniao, o fato de 
que o computador em si é posto fisicamente fora do cérebro 
nao é importante em termos filosdficos: com efeito, estamos 
ampliando o cérebro e substituindo, com um aparelho 
computadorizado, fungoes que nao atuam corretamente. Na 
década de 2030, quando aparelhos computadorizados 
inteligentes terao o tamanho de células sanguineas (e 
lembre-se de que as células brancas do sangue sao 
inteligentes a ponto de identificar e combater patédgenos), 
vamos’ introduzi-los de maneira nao invasiva, sem 
necessidade de cirurgia. 

Voltando a nosso cenario futuro, vocé passa pelo 
procedimento e, como prometido, tudo corre bem e algumas 
de suas habilidades melhoraram. (Provavelmente, sua 
memoria melhorou.) E entao, vocé ainda @€ vocé? 
Certamente, seus amigos pensam que sim. Vocé pensa que 
sim. Nao adianta argumentar que subitamente vocé ficou 
diferente. Sem duvida, vocé passou pela cirurgia para 
efetuar uma mudanca em alguma coisa, mas vocé ainda é 
vocé mesmo. Sua identidade nao mudou. A consciéncia de 
alguém nao assumiu de repente o controle do seu corpo. 

Bem, assim, estimulado por esses resultados, vocé decide 
realizar outra cirurgia, desta vez envolvendo uma regiao 
diferente do cérebro. O resultado € 0 mesmo: vocé sente 
alguma melhora na Sua Capacidade, mas vocé ainda é€ vocé. 

Deve ter ficado claro 0 que quero mostrar. Vocé continua 
a realizar cirurgias, Sua confiancga no processo s6 aumenta, 
até um momento em que vocé trocou todas as partes do seu 
cérebro. Em todas as ocasides, 0 procedimento foi realizado 
com cuidado para preservar todos os seus padroes e 
conexées neocorticais, de modo que vocé nao perdeu nada 


de sua personalidade, talentos ou memorias. Nunca houve 
um vocé e um Vocé 2; apenas vocé. Ninguém, inclusive 
voce, acha que vocé deixou de existir. De fato, vocé esta ai. 

Nossa conclusao: vocé ainda existe. Nao ha dilema nisso. 
Tudo esta bem. 

S6 um detalhe: vocé, apds o processo gradual de 
substituicao, é totalmente equivalente ao Vocé 2 no cenario 
mental anterior (que podemos chamar de cenario de 
varredura e representacao). Vocé, apds o cenario de 
substituigao gradual, tem todos os padroes e conexoes 
neocorticais que tinha originalmente, s6 que num substrato 
nao bioldgico, o que também se aplica ao Vocé 2 no cenario 
de varredura e representacao. Vocé, apds o cenario de 
substituigao gradual, tem algumas habilidades adicionais e 
mais durabilidade do que antes do processo, mas isso 
também se aplica ao Vocé 2 no processo de varredura e 
representacao. 

Mas nos concluimos que 0 Vocé 2 nao é vocé. E se vocé, 
apos o processo de substitui¢ao gradual, é totalmente 
equivalente ao Vocé 2 apos o processo de varredura e 
representacao, entao, apds o processo de_ substituicao 
gradual vocé também nao deve ser vocé. 

Todavia, isso contradiz nossa conclusao anterior. O 
processo de substituicao gradual consiste em miultiplas 
etapas. Cada uma dessas etapas parece ter preservado a 
identidade, assim como concluimos hoje que um paciente 
com mal de Parkinson tem a mesma identidade apos ter 
recebido a instalagao de um implante neural [22]. 

E esse tipo de dilema filosdfico que leva algumas pessoas 
a concluir que esses cenarios de substitui¢ao nunca vao 
acontecer (muito embora ja estejam ocorrendo). Mas pense 
nisto: nds passamos naturalmente por um processo gradual 


de substitui¢ao ao longo da vida. A maioria das células de 
nosso corpo é substituida continuamente. (Vocé acabou de 
substituir 100 milhdes delas enquanto leu a_ ultima 
sentenca.) Células no revestimento interno do intestino 
delgado sao trocadas ao longo de uma semana, bem como o 
revestimento protetor do est6mago. A vida das células 
brancas do sangue vai de alguns dias a alguns meses, 
dependendo do tipo. As plaquetas duram cerca de nove 
dias. 

Os neurénios persistem, mas suas organelas e suas 
moléculas constituintes sofrem uma troca a cada més [23]. 
O tempo médio de vida do microtubulo do neurénio é de dez 
minutos; os filamentos de actina nos dendritos duram 40 
segundos; as proteinas que proporcionam energia para as 
sinapses sao trocadas a cada hora; os receptores de NMDA 
nas sinapses tem uma vida relativamente longa: cinco dias. 

Por isso, vocé € completamente substituido em questao 
de meses, algo comparavel ao cenario de substituicao 
gradual que descrevi antes. Vocé 6 a mesma pessoa que era 
ha alguns meses? Claro que ha algumas diferencas. Talvez 
vocé tenha aprendido algumas coisas. Mas vocé presume 
que a sua identidade persiste, que vocé nao foi destrufdo e 
recriado continuamente. 

Pense num rio, como aquele que passa perto do meu 
escritorio. Enquanto vejo esse rio que as pessoas chamam 
de Rio Charles, pergunto-me se sera 0 mesmo rio que vi 
ontem. Primeiro, vamos refletir sobre 0 que significa um rio. 
O dicionario o define como “um curso grande e natural de 
agua corrente”. Segundo essa definicao, o rio que estou 
vendo hoje & completamente diferente do rio que vi ontem. 
Cada uma de suas moléculas de agua mudou, um processo 
que acontece muito rapidamente. O fildsofo grego Didgenes 


Laércio escreveu, no século 3 de nossa era, que “vocé nao 
consegue pisar duas vezes no mesmo rio”. 

Mas nao é assim que costumamos entender os rios. As 
pessoas gostam de vé-los porque eles sao simbolos de 
continuidade e de estabilidade. Segundo a visao comum, oO 
Rio Charles que vi ontem € 0 mesmo rio que vejo hoje. 
Nossas vidas sao parecidas. Fundamentalmente, nao somos 
as coisas que constituem nossos corpos e cérebros. Essas 
particulas fluem através de nds, assim como as moléculas de 
agua fluem por um rio. Somos um padrao que muda 
lentamente, mas que tem estabilidade e continuidade, 
embora as coisas que formam o padrao mudem 
rapidamente. 

A introducgao gradual de sistemas nao biolédgicos em 
nossos corpos e cérebros sera apenas outro exemplo da 
troca continua das partes que nos compodem. Ela nao vai 
alterar a continuidade de nossa identidade, e nem a 
substituigao natural de nossas células biolégicas o faz. Em 
grande parte, ja terceirizamos nossas memorias histo6ricas, 
intelectuais, sociais e pessoais em nossos aparelhos e na 
nuvem. Os aparelhos com que interagimos para ter acesso a 
essas memorias ainda nao estao dentro de nossos corpos e 
cérebros, mas, a medida que diminuem mais e mais (e 
estamos reduzindo 0 tamanho da tecnologia a razao de cem 
em volume tridimensional por década), eles vao obter 
acesso a eles. De qualquer maneira, sera um lugar util para 
guarda-los, assim, nao vamos perdé-los. Se as pessoas nao 
quiserem colocar aparatos microscépicos em seu corpo, nao 
fara mal, pois teremos outros meios de acessar a fugaz 
intelig@ncia na nuvem. 

Mas voltemos ao dilema que apresentei antes. Vocé, apds 
um periodo de substitui¢ao gradual, 6 equivalente ao Vocé 2 


do cenario de varredura e representacao, mas decidimos que 
o Vocé 2 desse cenario nao tem a mesma identidade que 
vocé. Aonde isso nos leva? 

Leva-nos a reconhecer uma capacidade dos sistemas nao 
bioldgicos que os sistemas biolégicos nao tém: a capacidade 
de ser copiado, armazenado e recriado. Fazemos isso 
rotineiramente com nossos aparelhos. Quando compramos 
um smartphone novo, copiamos todos os seus arquivos, e 
assim ele tem boa parte da personalidade, das habilidades e 
das memorias do smartphone antigo. Talvez tenha até 
algumas Capacidades novas, mas o conteudo do fone antigo 
ainda esta conosco. De modo analogo, certamente um 
programa como o Watson tem uma cépia de seguranga. Se o 
hardware do Watson fosse destruido amanha, Watson 
poderia ser recriado facilmente a partir de seus arquivos de 
seguranca armazenados na nuvem. 

Isso representa uma capacidade no mundo nao bioldégico 
que nao existe no mundo biolégico. E uma vantagem, nao 
uma limitacao, motivo pelo qual estamos tao ansiosos hoje 
para continuar a armazenar nossas memorias na nuvem. 
Com certeza, vamos prosseguir nessa direcao, pois sistemas 
nao bioldgicos obtém cada vez mais as capacidades de 
nosso cérebro bioldgico. 

Minha solucao para o dilema é€ esta: nao 6 verdade que 
Vocé 2 nao é vocé; ele é vocé. S6 que agora ha dois de vocé. 
Isso nao é tao ruim; se vocé se acha bom, entao dois de vocé 
€ ainda melhor. 

Aquilo que acho que vai acontecer de fato 6 que vamos 
continuar no caminho do cenario da _ substituicao e 
ampliagao gradual até que, em ultima analise, a maior parte 
de nosso pensamento esteja na nuvem. Meu salto de fé 
sobre a identidade é que esta 6 preservada mediante a 


continuidade do padrao de informacao que faz com que nos 
sejamos nos mesmos. A continuidade abre espaco para a 
mudanca continua, e assim, embora eu seja um pouco 
diferente do que era ontem, mantenho a mesma identidade. 
Entretanto, a continuidade do padrao que constitui minha 
identidade nao depende de _ substratos. Os substratos 
bioldgicos sao maravilhosos - levaram-nos até onde estamos 
-, mas estamos criando um substrato mais capaz e duravel 
por excelentes razoes. 


¢ Capitulo 10 « 


A lei dos retornos acelerados aplicada ao 
cérebro 


E embora cada homem deva permanecer, em alguns aspectos, 
como a criatura superior, isso nado esta de acordo com a pratica da 
natureza, que permite a superioridade em algumas coisas a animais 
que, como um todo, ha muito foram superados? Ela nao permitiu 
que a formiga e a abelha fossem superiores ao homem na 
Organizagao de suas comunidades e estruturas sociais, a ave na 
travessia do ar, Oo peixe na natacgao, o cavalo na forca e na 
velocidade, e 0 cao no autossacrificio? 

- Samuel Butler, 1871 


Houve uma época em que a Terra era, para todos os efeitos, 
totalmente destituida de vida animal e vegetal, e que, segundo a 
opiniao de nossos maiores fildsofos, era simplesmente uma bola 
redonda e quente com uma crosta esfriando gradualmente. Bem, se 
quando a Terra estava nesse estado existisse um ser humano que a 
visse como se fosse um outro mundo pelo qual nao tivesse interesse 
algum, e, ao mesmo tempo, esse ser humano fosse totalmente 
ignorante de toda ciéncia fisica, nao teria ele considerado impossivel 
que criaturas dotadas de qualquer coisa semelhante a consciéncia 
poderiam evoluir das cinzas que estava vendo? Nao teria negado 
que ela poderia abrigar toda possibilidade de consciéncia? Mas, com 
oO passar do tempo, a consciéncia chegou. Nao é possivel, portanto, 
que ainda haja canais escavados para a consciéncia, embora nao 
possamos hoje detectar seus sinais? 


- Samuel Butler, 1871 


Quando refletimos sobre as diversas fases da vida e da consciéncia 
que ja se desenvolveram, seria imprudente dizer que nenhuma 
outra pode se desenvolver, e que a vida animal é o final de todas as 
coisas. Houve uma época em que o fogo era o final de todas as 
coisas; outra, em que as pedras e a agua Oo eram. 

- Samuel Butler, 1871 


Nao existe seguranca contra o desenvolvimento supremo da 
consciéncia mecanica sé porque as maquinas possuem pouca 
consciéncia hoje. Um molusco nao tem muita consciéncia. Reflita no 
extraordinario progresso feito pelas maquinas nestes Ultimos séculos 
e veja como foi lento 0 avanco dos reinos animal e vegetal. As 
maquinas mais organizadas nao seriam propriamente de ontem, 
mas dos ultimos cinco minutos, por assim dizer, em comparacao 
com o tempo passado. Presuma, a titulo de argumento, que os seres 
conscientes existem ha cerca de 20 milhdes de anos: veja os passos 
largos dados pelas maquinas nos Ultimos mil! Sera que o mundo 
nao vai durar mais 20 milhOes de anos? E se durar, no que elas se 
transformarao? 

- Samuel Butler, 1871 


inha tese central, que chamo de lei dos retornos 
M acelerados (LRA), @€ que medidas fundamentais de 
tecnologia da informacao seguem trajetérias previsiveis e 
exponenciais, desmentindo a sabedoria convencional de que 
“nao da para prever o futuro”. Ainda ha muitas coisas - que 
projeto, empresa ou padrao técnico prevalecera no mercado 
quando a paz chegar ao Oriente Médio - que permanecem 
desconhecidas, mas a relagao preco/desempenho e a 
capacidade de _  informacao tém_ sido notavelmente 
previsiveis. Surpreendentemente, essas tendéncias nao sao 
abaladas por condi¢cdes como guerra ou paz, prosperidade 
ou recessao. 


Um motivo primario para a evolucao ter criado o cérebro 
foi a predicao do futuro. Enquanto um de nossos ancestrais 
caminhava pelas savanas, milhares de anos atras, ele pode 
ter notado que um animal estava se aproximando da rota 
que ele seguia. Ele previu que, se ficasse nessa rota, seus 
Caminhos se cruzariam. Com base nisso, ele decidiu seguir 
em outra direcao, e sua antevisao mostrou-se valiosa para a 
sobrevivéncia. 

Mas esses previsores de futuro embutidos em nos sao 
lineares, nao exponenciais, uma qualidade que deriva da 
organizacao linear do neocdrtex. Lembre-se de que o 
neocortex esta sempre fazendo previsdes: que letra e que 
palavra veremos a seguir, quem esperamos ver ao virar a 
esquina, e assim por diante. O neocdrtex esta organizado 
em sequéncias lineares de etapas em cada padrao, 0 que 
significa que oO pensamento exponencial nao surge 
naturalmente em nos. O cerebelo também usa predicdes 
lineares. Quando queremos pegar uma bola alta no beisebol, 
ele faz a previsao linear do ponto em que a bola estara em 
nosso campo de visao e de onde a mao enluvada deveria 
estar em nosso campo de visao para pega-la. 

Como disse, existe uma _ diferenca drastica entre 
progressoes lineares e exponenciais (em termos lineares, 40 
etapas lineares sao 40, mas exponencialmente sao um 
trilhao), o que explica por que as previsoes que fiz com base 
na lei dos retornos acelerados parecem, no_ inicio, 
Surpreendentes para muitos observadores. Precisamos nos 
educar para pensar exponencialmente. Quando se trata de 
tecnologia da informacao, é a maneira correta de pensar. 

O exemplo quintessencial da lei dos retornos acelerados 
€ o crescimento perfeitamente suave e duplamente 
exponencial da relacao preco/desempenho da computacao, 


que tem se mantido firme nos ultimos 110 anos, 
atravessando duas guerras mundiais, a Grande Depressao, a 
Guerra Fria, 0 colapso da Uniao Soviética, a reaparicao da 
China, a recente crise financeira e todos os outros eventos 
notaveis do final do século 19, do século 20 e do inicio do 
século 21. Algumas pessoas se referem a esse fendmeno 
como “lei de Moore”, mas esse € um conceito errdneo. A lei 
de Moore - que afirma que vocé pode colocar o dobro de 
componentes num circuito integrado a cada dois anos, e que 
eles sao mais rapidos porque sao menores - 6 apenas um 
paradigma entre muitos. Na verdade, foi 0 quinto, e nao o 
primeiro paradigma a levar o crescimento exponencial a 
relagcao preco/desempenho da computacao. 

O crescimento exponencial da computacgao comecou com 
o censo de 1890 dos EVA (0 primeiro a ser automatizado), 
usando o primeiro paradigma do calculo eletromecanico, 
décadas antes de Gordon Moore ter nascido. Em The 
singularity is near, apresento esse grafico até 2002, e aqui 
eu o atualizei até 2009 (veja o grafico na pagina 309 
intitulado “Crescimento Exponencial da Computacgao em 
110 anos”). A_ trajetéria suavemente_ previsivel tem 
continuado, mesmo depois da_ recente reviravolta 
econdémica. 

A computacao é o exemplo mais importante da lei dos 
retornos acelerados em funcao da quantidade de dados que 
temos para ela, da onipresenca da computacao e de seu 
papel crucial na revolucao suprema de tudo que nos 
interessa. Mas ela esta longe de ser 0 Unico exemplo. Depois 
que uma tecnologia se transforma numa tecnologia da 
informacao, ela se torna sujeita a LRA. 
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Custo de sequenciamento de um genoma de tamanho humano [1] 
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Quantidade de dados genéticos sequenciados no mundo a cada ano [2] 


A biomedicina esta se tornando a area mais importante e 
recente da tecnologia e da industria a se transformar dessa 


maneira. Historicamente, 0 progresso da medicina tem se 
baseado em descobertas acidentais, e por isso 0 progresso 
no inicio da era foi linear e nao exponencial. Contudo, isso 
se mostrou benéfico: ha um milénio, a expectativa de vida 
era de 23 anos; ha dois séculos, passou a ser de 37; hoje é 
de aproximadamente 80 anos. Com a coleta do software da 
vida, 0 genoma, a medicina e a biologia humana tornaram- 
se parte da tecnologia da informacao. O prdprio Projeto 
Genoma foi perfeitamente exponencial, com a quantidade 
de dados genéticos dobrando e o custo por par de bases 
reduzindo-se pela metade a cada ano, desde que o projeto 
foi iniciado em_1990 [3]. (Todos os graficos deste capitulo 
foram atualizados desde a publicacgao de The singularity is 
near.) 


Hoje somos capazes de projetar intervencdes biomédicas 
em computadores e de testa-las depois em simuladores 
bioldgicos, cuja escala e precisao também estao dobrando a 
cada ano. Também podemos atualizar nosso prdprio software 
obsoleto: a interfer€ncia no RNA pode desativar genes, e 
novas formas de terapia genética podem acrescentar novos 
genes, nao apenas a um recém-nascido, como a um 
individuo maduro. O progresso das tecnologias genéticas 
também afeta o projeto de engenharia reversa do cérebro, 
pois um de seus aspectos importantes é entender como os 
genes controlam func6des cerebrais como a criacgao de novas 
conexoes para refletir conhecimentos corticais recentemente 
acrescentados. Ha muitas outras manifestacdes dessa 
integracao entre biologia e tecnologia da informacao, como 
a passagem do sequenciamento do genoma para a 
sintetizagao do genoma. 


Outra tecnologia da informagao que tem visto um 
crescimento exponencial uniforme @ nossa capacidade de 
nos comunicar uns com os outros e de transmitirmos 
grandes compilacées de conhecimento humano. Ha muitas 
maneiras de medir esse fenédmeno. A lei de Cooper, que 
afirma que a capacidade total em bits das comunicac6es 
sem fio numa dada quantidade de espectro de radio dobra a 
cada 30 meses, tem se mantido firme desde a época em que 
Guglielmo Marconi usou o telégrafo sem _ fio para 
transmissoes de cédigo Morse, em 1897, até as tecnologias 
de comunicacgao 4G de hoje [4]. Segundo a lei de Cooper, a 
quantidade de informacao que pode ser transmitida dentro 
de determinado espectro de radio tem dobrado a cada dois 
anos e meio, ha mais de um século. Outro exemplo é o 
numero de bits por segundo transmitidos pela Internet, que 
vem dobrando a cada 15 meses [5]. 

A razao pela qual eu me interessei em tentar predizer 
certos aspectos da tecnologia é que percebi, ha cerca de 30 
anos, que a chave para ser bem-sucedido como inventor 
(profissao que adotei quando tinha 5 anos de idade) é o 
senso de oportunidade. A maioria das invencoes e dos 
inventores fracassa nao porque os aparelhos nao funcionam, 
mas porque 0 momento nao era o adequado, aparecendo 
antes que todos os fatores propicios estivessem no lugar, ou 
tarde demais, perdendo a janela de oportunidade. 

Como engenheiro, ha cerca de trés décadas comecei a 
reunir dados sobre medidas da tecnologia em diversas areas. 
Quando iniciei esse trabalho, nao esperava que ele fosse 
apresentar uma imagem clara, mas esperava que 
proporcionasse certa orientacao e me permitisse dar palpites 
bem embasados. Minha meta era - e ainda é - cronometrar 
meus prdprios esfor¢cos tecnoldgicos para que sejam 


apropriados para o estado do mundo quando eu concluir um 
projeto, que, segundo percebi, seria muito diferente do 
mundo que existia quando comecei. 
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Largura de banda internacional (de pais para pais) dedicada a Internet para o 
mundo [6] 
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A maior largura de banda da estrutura da Internet [7] 


Pense em quanto 0 mundo mudou recentemente, e com 
que velocidade. Ha poucos anos, as pessoas nao usavam 
redes sociais (0 Facebook, por exemplo, foi fundado em 
2004 e tinha 901 milhdes de usuarios ativos mensalmente 
no final de marco de 2012 [8]), wikis, blogs ou tuites. Na 
década de 1990, a maioria das pessoas nao usava 
mecanismos de busca nem celulares. Imagine 0 mundo sem 
eles. Isso parece histéria antiga, mas nao faz tanto tempo 
assim. O mundo vai mudar ainda mais drasticamente no 
futuro proximo. 

No decorrer de minha investigacao, fiz uma descoberta 
surpreendente: se uma tecnologia @€ uma tecnologia de 
informacgao, aS medidas basicas de preco/desempenho e 
Capacidade (por unidade de tempo, de custo ou de outro 
recurso) acompanham  trajetérias exponenciais com 
espantosa precisao. 


Essas trajetoérias superam os paradigmas especificos em 
que estao baseadas (como a lei de Moore). Mas quando um 
paradigma perde o fdlego (por exemplo, quando os 
engenheiros nao conseguiram mais reduzir o tamanho e o 
custo dos tubos de vacuo na década de 1950), isso cria 
pressao na area de pesquisa para criar oO paradigma 
seguinte, e assim tem inicio nova curva-S de progresso. 

A porcao exponencial dessa préxima curva-S do novo 
paradigma da continuidade a exponencial continua de 
medida da tecnologia da informacao. Logo, a computacao 
baseada em tubos a vacuo da década de 1950 deu lugar aos 
transistores na década de 1960 e depois aos circuitos 
integrados e a lei de Moore no final da década de 1960, e 
mais além. A lei de Moore, por sua vez, dara lugar a 
computacao tridimensional, e os primeiros exemplos dela ja 
estao em andamento. O motivo pelo qual as tecnologias da 
informacao sao capazes de transcender consistentemente as 
limitacédes de qualquer paradigma em particular 6 que os 
recursos necessarios para computar ou lembrar ou transmitir 
um bit de informacao sao extremamente pequenos. 

Podemos nos perguntar: ha limites fundamentais para 
nossa capacidade de computar e de transmitir informac6ées, 
independentemente do paradigma? A resposta é sim, com 
base no que conhecemos hoje sobre a fisica da computacao. 
Esses limites, porém, nao sao muito restritivos. Em ultima 
analise, podemos expandir nossa inteligéncia trilhées de 
vezes COM apoio na computacao molecular. Segundo meus 
calculos, vamos atingir esses limites no final deste século. 

E importante destacar que nem _ todo fendmeno 
exponencial exemplifica a lei dos retornos acelerados. 
Alguns observadores interpretam erroneamente a LRA 
citando tendéncias exponenciaiS que nao se baseiam em 


informacgoes. Mencionam, por exemplo, os barbeadores 
masculinos, que passaram de uma lamina para duas e para 
quatro, e perguntam onde estao os barbeadores com oito 
laminas. Barbeadores (ainda) nao sao uma tecnologia da 
informacao. 

Em The singularity is near, apresentei um exame tedrico, 
inclusive (no apéndice desse livro) um_ tratamento 
matematico da razao para que a LRA seja tao notavelmente 
previsivel. Essencialmente, sempre usamos a tecnologia 
mais recente para criar a seguinte. Tecnologias se acumulam 
umas sobre as outras de maneira exponencial, e esse 
fendmeno é prontamente mensuravel se envolver alguma 
tecnologia da _ informacgao. Em 1990, usamos’- os 
computadores e outras ferramentas daquela era para criar 
os computadores de 1991; em 2012, estamos usando as 
atuais ferramentas da informacao para criar aS maquinas de 
2013 e 2014. Falando em termos mais amplos, essa 
aceleragao e o crescimento exponencial se aplicam a 
qualquer processo no qual se desenvolvam padroes de 
informagcao. Assim, vemos a aceleracao no ritmo da evolucao 
bioldgica, e uma aceleracao similar (mas muito mais rapida) 
na evolucao tecnoldgica, que, em si, é fruto da evolucao 
bioldgica. 

Tenho hoje um registro publico com mais de um quarto 
de século de predicées feitas com base na lei dos retornos 
acelerados, comecando por aquelas apresentadas em The 
age of intelligent machines, que escrevi em meados da 
década de 1980. Entre exemplos de predicd6es precisas 
desse livro temos: o surgimento, entre meados e final da 
década de 1990, de uma vasta rede mundial de 
comunicacgdes unindo pessoas ao redor do mundo umas as 
outras e a todo 0 conhecimento humano; uma grande onda 


de democratizagao emergindo dessa rede descentralizada 
de comunicacoes, varrendo do mapa a Uniao Soviética; a 
derrota do campeao mundial de xadrez por volta de 1998; e 
muitas outras. 

Descrevi detalhadamente a lei dos retornos acelerados, 
tal como se aplica a computacao, em A era das mdaquinas 
espirituais, onde apresentei um século de dados mostrando 
a progressao duplamente~ espiritual da _ relacao 
preco/desempenho da computacao até 1998. Atualizei-a até 
2009 a seguir. 

Recentemente, escrevi uma analise de 146 paginas das 
predicoes que fiz em The age of intelligent machines, A era 
das mdaquinas espirituais e The singularity is near. (Para ler o 
ensaio, visite o link reproduzido nesta nota [9].) A era das 
maquinas espirituais incluiu centenas de predicdes para 
décadas especificas (2009, 2019, 2029 e 2099). Fiz, por 
exemplo, 147 predicodes para 2009 em A era das maquinas 
espirituais, que escrevi na década de 1990. Delas, 115 
(78%) estavam totalmente corretas até o final de 2009; as 
predicoes que tratavam de medidas basicas de capacidade e 
da _ relagao preco/desempenho das_ tecnologias da 
informacao foram particularmente precisas. 
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Operacédes em ponto flutuante por segundo de diversos supercomputadores 
[11] 
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Transistores por chip de diversos processadores Intel [12] 
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Bits por ddlar de chips de memoria de acesso aleatdério dinamico 
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Bits por ddlar de chips de memoria de acesso aleat6rio [14] 
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Preco médio por transistor em dolares [15] 
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Bits por ddlar (em ddlares constantes de 2000) de armazenamento magnético 
de dados [17] 


Outras 12 (8%) foram “essencialmente corretas”. No 
total, 127 predicdes (86%) foram corretas ou essencialmente 
corretas. (Como as predicoes foram feitas especificamente 
numa década especifica, uma predicao para 2009 foi 
considerada “essencialmente correta” se foi verdadeira em 
2010 ou 2011.) Outras 17 (12%) foram parcialmente 
corretas, e trés (2%) erradas. 

Mesmo as predicoes que foram “erradas” nao o foram de 
todo. Por exemplo, julguei que minha predigao de que 
teriamos carros que se conduziam sozinhos estava errada, 
apesar de o Google ter demonstrado seus carros 
autodirigidos, e apesar de, em outubro de 2010, quatro vans 
elétricas sem motorista terem concluido com sucesso um 
test-drive de 13 mil quilémetros, da Italia até a China [18]. 
Especialistas da area predisseram atualmente que essas 
tecnologias estarao disponiveis  rotineiramente para 
consumidores até o final desta década. 

A expansao exponencial das tecnologias da computac¢ao 
e das comunicagoes contribui para o- projeto de 
compreender e recriar os métodos do cérebro humano. Esse 
esforco nao é um projeto organizado individualmente, mas o 
resultado de muitos projetos diferentes e grandiosos, 
inclusive a modelagem detalhada de constituintes do 
cérebro, que vao de neurdénios individuais até o neocdrtex 
como um todo, 0 mapeamento do “conectoma” (as conexdes 
neurais do cérebro), simulacdes de regides cerebrais e 
muitas outras. Tudo isso vem crescendo em _ escala 
exponencial. Muitas evidéncias apresentadas neste livro sé 
se tornaram disponiveis recentemente, como, por exemplo, o 
estudo Wedeen de 2012, discutido no capitulo 4, que 
mostrou 0 padrao de grade muito organizado e “simples” 
(citando os pesquisadores) das conexdes do neocortex. Os 


pesquisadores nesse estudo admitem que seu /nsight (e as 
imagens) so se tornaram viaveis como resultados da nova 
tecnologia de imagens em alta resolucao. 





Diagrama de Venn de métodos de mapeamento cerebral [19] 


A lei dos retornos acelerados aplicada ao cérebro 
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Resolucao espacial da IRM em microns [21] 
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Resolucdo espacial de técnicas destrutivas de mapeamento [22] 
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Resolucdao espacial de técnicas nado destrutivas de mapeamento cerebral em 
animais [23] 


As tecnologias de varredura cerebral estao melhorando 
em resolucgao espacial e temporal, a um ritmo exponencial. 
Os diversos tipos de métodos de varredura cerebral em 
desenvolvimento vao de métodos completamente nao 
invasivos, que podem ser usados com humanos, a métodos 
mais invasivos ou destrutivos em animais. 

A IRM (imagem por ressonancia magnética), uma técnica 
nao invasiva de mapeamento com resolugao temporal 
relativamente elevada, tem melhorado firmemente em ritmo 
exponencial, a ponto de a resolucao espacial estar hoje 
proxima de 100 microns (milionésimos de metro). 

O mapeamento destrutivo, realizado para coletar o 
conectoma (mapa de todas as conex6oes interneuronais) em 
cérebros animais, também melhorou em ritmo exponencial. 
A atual resolucao maxima esta prdxima de quatro 
nandémetros, que é€ suficiente para vermos as conexdes 
isoladamente. 

As tecnologias de inteligéncia artificial como sistemas de 
compreensao de linguagem natural nao Sao 
necessariamente projetadas para emular — principios 
teorizados de funcdes cerebrais, maS para uma eficacia 
maxima. Sabendo disso, é notavel que as técnicas que se 
sobressairam sejam consistentes com os principios que 
delineei neste livro: identificadores hierarquicos auto- 
organizados de padroes autoassociativos invariantes com 
redundancia e predicdes ascendentes e descendentes. Esses 
sistemas também estao evoluindo exponencialmente, como 
Watson demonstrou. 

Um dos principais propdsitos para compreendermos o 
cérebro 6 expandir nossa caixa de ferramentas e técnicas 
para a criagao de sistemas inteligentes. Embora muitos 
pesquisadores de IA nao aceitem isso plenamente, eles ja 


foram bastante influenciados pelo nosso conhecimento dos 
principios de operacao do cérebro. Compreender o cérebro 
também nos ajuda a reverter disfuncdes cerebrais de 
diversas espécies. Naturalmente, ha outra meta importante 
no projeto para fazer a engenharia reversa do cérebro: 
compreender quem somos. 


¢ Capitulo 11 » 


Objecoes 


Se uma maquina se mostra indistinguivel de um humano, devemos 
estender a ela o respeito devido a um humano; devemos aceitar que 
ela possui uma mente. 

- Stevan Harnad 


mais importante fonte de objecdes a minha tese sobre a 

lei dos retornos acelerados e sua aplica¢ao a ampliacao 
da intelig@ncia Numana deriva da natureza linear da 
intuigao humana. Como descrevi antes, cada um dentre 
varias centenas de milhdes de identificadores de padrdes do 
neocortex processam informacées de forma sequencial. Uma 
das implicacdes dessa organizacao 4€ que _ temos 
expectativas lineares sobre o futuro, e assim os criticos 
aplicam sua intuicao linear a fenémenos de informacao que 
sao fundamentalmente exponenciais. 

Chamo as objecdes dentro dessas linhas de “criticas da 
incredulidade”, pois aS projecoes exponenciais parecem 
incriveis tendo em vista nossa predilecao linear, e elas 
assumem diversas formas. O cofundador da Microsoft, Paul 
Allen (nascido em 1953), e seu colega Mark Greaves 
manifestaram recentemente diversas delas num _ ensaio 
intitulado “The Singularity Isn’t Near”, publicado na revista 
Technology Review [1]. Embora minha resposta aqui seja as 


criticas especificas de Allen, ela representa uma gama tipica 
de objecoes aos argumentos que levantei, especialmente 
com relag¢ao ao cérebro. Apesar de Allen mencionar The 
singularity is near no titulo de seu ensaio, sua Unica citacgao 
no trabalho é a de um ensaio que escrevi em 2001 (“The 
Law of Accelerating Returns”). Ademais, seu artigo nao 
identifica nem responde a argumentos que levantei no livro. 
Infelizmente, percebo que costuma ser essa a atitude dos 
criticos de meu trabalho. 

Quando A era das maquinas espirituais foi publicado em 
1999 e ampliado posteriormente pelo ensaio de 2001, gerou 
varias linhas de criticas, como: a /ei de Moore vai acabar; a 
capacidade do hardware pode estar se expandindo 
rapidamente, mas o software esta atolado na lama; o 
cérebro € complicado demais; o cérebro tem capacidades 
gue nao podem ser replicadas inerentemente por software; 
e muitas outras. Uma das razOes para ter escrito The 
singularity is near foi para responder a essas criticas. 

Nao posso dizer que Allen e criticos similares ficariam 
necessariamente convencidos pelos argumentos que 
levantei naquele livro, mas pelo menos ele e outros 
poderiam ter respondido aquilo que realmente escrevi. Allen 
argumenta que “a Lei dos Retornos Acelerados (LRA) [...] nao 
€ uma lei da fisica”. Eu lembraria que a maioria das leis 
cientificas nao sao leis da fisica, mas resultam das 
propriedades emergentes de um grande numero de eventos 
num nivel inferior, Um exemplo classico sao as leis da 
termodinamica (LT). Se  analisarmos a matematica 
envolvendo as LT, veremos que ela modela cada particula 
como se seguisse um trajeto aleatério, e por isso, por 
defini¢ao, nao podemos prever onde cada_ particula 
especifica estara num momento futuro. Mas as propriedades 


globais do gas sao previsiveis com elevado grau de precisao, 
segundo as /e/s da termodinamica. O mesmo acontece com a 
lei dos retornos acelerados: os projetos e os colaboradores 
da tecnologia sao imprevisiveis, mas a trajetéria geral, 
quantificada por medidas basicas de preco/desempenho e 
Capacidade, seguem um caminho notavelmente previsivel. 

Se a tecnologia dos computadores estivesse sendo 
trabalhada apenas por um punhado de _ pesquisadores, 
certamente seria imprevisivel. Mas @ fato em um sistema 
suficientemente dinamico de projetos competitivos que uma 
medida basica de sua relagao preco/desempenho, como 
calculos por segundo por dolar constante, segue um 
caminho exponencial muito uniforme, recuando ao censo 
norte-americano de 1890, como observei no capitulo 
anterior. Embora a base tedrica da LRA tenha_ sido 
apresentada em detalhes em The singularity is near, sua 
defesa mais forte esta na vasta evidéncia empirica que eu e 
outros autores apresentamos. 

Allen escreve que “essas ‘leis’ funcionam até pararem de 
funcionar”. Aqui, ele esta confundindo os paradigmas com a 
trajetoria continua de uma area basica da tecnologia da 
informacao. Se estivéssemos examinando, por exemplo, a 
tendéncia de criacao de tubos de vacuo cada vez menores - 
O paradigma para melhoria da computacgao na década de 
1950 -, 6 verdade que ela continuou até parar. Mas quando 
o fim desse paradigma em particular ficou claro, a pressao 
sobre a pesquisa aumentou para o paradigma seguinte. A 
tecnologia dos transistores manteve a tendéncia subjacente 
do crescimento exponencial de preco/desempenho, o que 
levou ao quinto paradigma (a lei de Moore) e a compressao 
continua dos componentes dos circuitos integrados. Temos 
visto predicoes regulares de que a lei de Moore vai chegar 


ao fim. O “International Technology Roadmap for 
Semiconductors” (Mapa Internacional de Tecnologia de 
Semicondutores), da industria de semicondutores, projeta 
componentes de sete nanémetros para o inicio da década de 
2020 [2]. Nesse ponto, os principais elementos terao a 
largura de 35 atomos de carbono, e sera dificil continuar a 
encolhé-los ainda mais. Contudo, a Intel e outros fabricantes 
de chips ja estao dando os primeiros passos na direcao do 
sexto paradigma, a computacao em trés dimens6des, para 
continuar a melhora exponencial da relacao 
preco/desempenho. A_ Intel projeta que os_~ chips 
tridimensionais serao corriqueiros em mais de 12 anos; 
transistores tridimensionais e chips de memoria 3D ja foram 
apresentados. O sexto paradigma vai manter a LRA em 
funcionamento no que concerne a relagao preco de 
computadores/desempenho até um momento posterior 
deste século, quando mil ddlares de computador serao 
trilhdes de vezes mais poderosos do que o cérebro humano 
[3]. (Aparentemente, Allen e eu estamos no minimo de 
acordo sobre o nivel de computacao necessario para simular 
funcionalmente o cérebro humano [4].) 

Depois, Allen continua, mencionando o argumento- 
padrao de que o software nao esta progredindo da mesma 
maneira exponencial que o hardware. Tratei minuciosamente 
dessa questao em The singularity is near, citando diversos 
métodos para se medir complexidade e capacidade em 
software que demonstram um crescimento exponencial 
similar [5]. Um estudo recente (“Report to the President and 
Congress, Designing a Digital Future: Federally Funded 
Research and Development in Networking and Information 
Technology”, realizado pelo President’s Council of Advisors 
on Science and Technology (Conselho Consultivo sobre 


Ciéncia e Tecnologia da presidéncia dos EUA) afirma o 
seguinte: 


Ainda mais notavel - e ainda menos compreendido - é que, em 
muitas areas, oS ganhos em desempenho devidos a melhorias nos 
algoritmos excederam em muito até mesmo os drasticos ganhos 
devidos a melhoria na velocidade dos processadores. Os algoritmos 
que usamos hoje para reconhecimento de fala, para traducao de 
linguagem natural, para jogar xadrez, para planejamento logistico, 
evoluiram notavelmente na década passada... Eis apenas um 
exemplo, proporcionado pelo professor Martin Grotschel, do Konrad- 
Zuse-Zentrum fur Informationstechnik Berlin. Grétschel, especialista 
em otimizagao, observa que um modelo de planejamento de 
producao ideal, usando programacao linear, teria levado 82 anos 
para ser criado em 1988, usando-se os computadores e os 
algoritmos de programacao linear da época. Quinze anos depois, em 
2003, esse mesmo modelo poderia ser resolvido aproximadamente 
num minuto, uma melhora da ordem aproximada de 43 milhdes de 
vezes. Disso, um fator de cerca de 1.000 deveu-se a um aumento 
na velocidade dos processadores, enquanto um fator aproximado de 
43 mil deveu-se a melhoras nos algoritmos! Grdtschel também 
menciona uma melhora nos algoritmos de cerca de 3 mil na 
programacao integral mista, entre 1991 e 2008. O projeto e a 
analise de algoritmos, e o estudo da complexidade computacional 
intrinseca dos problemas, sao subcampos fundamentais da ciéncia 
da computacao. 


Perceba que a programacao linear citada acima por 
Grodtschel, que teve beneficios em desempenho de 43 
milhdoes para 1, 6 a técnica matematica usada para atribuir 
recursos de forma ideal num_ sistema hierarquico de 
memoria, como o HHMM de que falei antes. Cito muitos 
outros exemplos similares como esse em The singularity is 
near [6]. 

Quanto a IA, Allen descarta rapidamente o Watson da 
IBM, uma opiniao compartilhada por muitos outros criticos. 


Muitos desses detratores nao sabem nada sobre Watson, 
além do fato de ser um software que roda num computador 
(embora seja um paralelo com 720 processadores). Allen 
escreve que_ sistemas como Watson “permanecem 
quebradicos, seus limites de desempenho sao determinados 
rigidamente por suas premissas internas e algoritmos de 
defini¢ao, eles nao podem generalizar, e frequentemente 
dao respostas sem sentido, fora de suas areas especificas”. 

Antes de qualquer coisa, poderiamos fazer um 
comentario similar sobre humanos. Eu também lembraria 
que as “areas especificas” de Watson incluem toda a 
Wikipédia, além de muitas outras bases de conhecimento, o 
que nao é€ propriamente um foco estreito. Watson lida com 
uma vasta gama de conhecimentos e é capaz de lidar com 
formas sutis de linguagem, inclusive jogos de palavras, 
analogias e metaforas, praticamente em todos os campos da 
atividade humana. Ele nao é perfeito, mas tampouco o sao 
os humanos, e foi bom o suficiente para ser vitorioso em 
Jeopardy!, enfrentando os melhores jogadores humanos. 

Allen argumenta que Watson foi montado pelos prdéprios 
cientistas, que construfram cada link de conhecimento 
estreito em areas especificas. Isso nao € verdade, pura e 
simplesmente. Apesar de algumas areas dos dados de 
Watson terem sido programadas diretamente, Watson 
adquiriu a maioria significativa de seus conhecimentos por 
conta propria, lendo documentos em linguagem natural 
como a Wikipédia. Isso representa seu principal talento, 
além de sua capacidade de compreender a complexa 
linguagem das perguntas de Jeopardy! (respostas em busca 
de questoes). 

Como mencionei antes, muitas das criticas a Watson se 
referem ao fato de ele trabalhar com. probabilidades 


estatisticas e@€ nao com uma compreensao “verdadeira”. 
Muitos leitores interpretam isso como se Watson estivesse 
apenas reunindo estatisticas sobre sequéncias de palavras. 
A expressao “informacao estatistica”, no caso de Watson, 
refere-se, na verdade, a coeficientes distribuidos e a 
conexées simbdlicas em métodos auto-organizados como os 
Modelos Hierarquicos Ocultos de Markov. Do mesmo modo, 
seria possivel desconsiderar facilmente as concentracées de 
neurotransmissores e os padroes de conexao redundantes 
distribuidos pelo cdrtex humano como “informacao 
estatistica”. Na verdade, resolvemos ambiguidades de 
maneira muito similar a de Watson: levando em conta a 
probabilidade de interpretacdes diferentes de uma frase. 

Allen prossegue: “Cada estrutura [do cérebro] foi 
moldada com precisao por milhdes de anos de evolucao para 
fazer determinada coisa, qualquer que ela seja. Ele nao é 
como um computador, com bilhdes de transistores idénticos 
em fileiras regulares de memoria, controlados por uma CPU 
com alguns elementos diferentes. No cérebro, cada estrutura 
individual e circuito neural foi refinado individualmente pela 
evolucao e por fatores ambientais”. 

Essa alegacao de que cada estrutura e circuito neural do 
cérebro € unica e existe intencionalmente é simplesmente 
impossivel, pois significaria que o projeto do cérebro exigiria 
centenas de trilhoes de bytes de informacao. O plano 
estrutural do cérebro (como o do resto do corpo) esta 
contido no genoma, e o cérebro em si nao pode conter mais 
informagao de design do que o genoma. Perceba que a 
informacao epigenética (como os peptideos que controlam a 
expressao dos genes) nao acrescenta nada apreciavel a 
quantidade de informacao do genoma. Experiéncia e 
aprendizado acrescentam significativamente a quantidade 


de informacoes contida no cérebro, mas 0 mesmo pode ser 
dito de sistemas de IA como Watson. Em The singularity Is 
near, mostrei que, apdos a compressao sem perdas (devida a 
macica redundancia no genoma), a quantidade de 
informacoes de design no genoma é de 50 milhdes de bytes, 
e€ aproximadamente metade disso (ou seja, 25 milhdes de 
bytes) pertence ao cérebro [7]. Isso nao é simples, mas € um 
nivel de complexidade com o qual podemos lidar, e 
representa menos complexidade do que muitos sistemas de 
software do mundo moderno. Ademais, boa parte dos 25 
milhdes de bytes de informacao de design genético pertence 
aos requisitos bioldgicos dos neurdnios, € nao a seus 
algoritmos de processamento de informacao. 

Como chegamos a ordem de cem a mil trilhées de 
conexées no cérebro a partir de apenas dezenas de milhées 
de bytes de informacao de design? Obviamente, a resposta 
@: redundancia macica. Dharmendra Modha, gerente de 
Computacgao Cognitiva para a IBM Research, escreve que 
“neuroanatomistas nao encontraram uma rede 
desesperadamente emaranhada e conectada 
arbitrariamente, completamente idiossincratica ao cérebro 
de cada individuo, mas muitas estruturas repetidas dentro 
de cada cérebro e uma boa quantidade de homologia em 
toda a espécie... A espantosa reconfigurabilidade natural da 
a esperanca de que _ os algoritmos centrais da 
neurocomputacao sejam independentes das modalidades 
sensoriais Ou motoras especificas, e que boa parte da 
varia¢ao observada na estrutura cortical ao longo das areas 
represente um refinamento de um circuito canénico; com 
efeito, @ nesse circuito canénico que queremos fazer a 
engenharia reversa [8]”. 


Allen defende um “freio de complexidade” inerente que 
“necessariamente limitaria 0 progresso na compreensao do 
cérebro humano e na replicacao de suas capacidades”, 
baseado em sua ideia de que cada uma das cem a mil 
trilh6es de conexdes do cérebro humano esta la por um 
design explicito. Seu “freio de complexidade” confunde a 
floresta com as arvores. Se vocé deseja compreender, 
modelar, simular e recriar um pancreas, nao precisa recriar 
ou simular cada organelo de cada célula insular pancreatica. 
O que vocé faria seria compreender uma célula insular, 
abstrair sua funcionalidade basica, que é o controle da 
insulina, e estender isso para um grande numero de tais 
células. Esse algoritmo esta bem compreendido com relacao 
as células insulares. Hoje, ha pancreas artificiais que 
utilizam esse modelo funcional em teste. Apesar de haver 
certamente mais complexidade e variagao no cérebro do 
que nas células insulares do pancreas, macicamente 
repetidas, ha, ainda assim, uma repeti¢ao macica das 
fungoes, como descrevi repetidas vezes neste livro. 

Criticas similares as de Allen constituem o que chamo de 
“pessimismo do cientista”. Pesquisadores que trabalham na 
proxima geracao de uma tecnologia ou na modelagem de 
uma area cientifica estao sempre lutando com esse conjunto 
de desafios, e assim, se alguém descreve a aparéncia da 
tecnologia dali a dez geracoes, eles ficam com os olhos 
vidrados. Um dos pioneiros dos circuitos integrados estava 
me contando recentemente o esfor¢o para passar de 
componentes com 10 microns (10 mil nanémetros) para 5 
microns (5 mil nanémetros), 30 anos atras. Os cientistas 
estavam cautelosamente confiantes no cumprimento dessa 
meta, mas quando as pessoas previram que um dia teriamos 
circuitos com componentes de tamanho inferior a 1 micron 


(mil nandémetros), a maioria deles, com foco em suas 
proprias metas, achou que isso era alucinante demais para 
se pensar. Fizeram objecdes quanto a fragilidade de circuitos 
com esse nivel de precisao, efeitos termais e assim por 
diante. Hoje, a Intel esta comecando a usar chips com portas 
de 22 nanémetros de comprimento. 

Testemunhamos o mesmo tipo de pessimismo com 
rela¢ao ao Projeto do Genoma Humano. Na metade do 
projeto de 15 anos, apenas 1% do genoma tinha sido 
coletado, e os criticos propunham limites basicos sobre a 
velocidade com que ele poderia ser sequenciado sem se 
destruir as delicadas estruturas genéticas. Porém, gracas ao 
crescimento exponencial, tanto em capacidade como em 
preco/desempenho, o projeto foi concluido sete anos depois. 
O projeto para fazer a engenharia reversa do cérebro 
humano esta tendo progressos similares. S6 recentemente, 
por exemplo, atingimos um limiar com técnicas de varredura 
nao invasiva para podermos ver cada uma das conexodes 
interneuronais se formando e disparando em tempo real. 
Muitas evidéncias que apresentei neste livro dependeram 
desses desenvolvimentos e sd se tornaram disponiveis 
recentemente. 

Allen descreve minha proposta para fazer a engenharia 
reversa do cérebro humano como uma simples varredura do 
cérebro. para compreender sua_ estrutura_ delicada, 
simulando-se depois um cérebro inteiro “de baixo para 
cima” sem compreender seus métodos de processamento de 
informagoes. Essa nao é minha _ proposta. Precisamos 
compreender em detalhes como funciona cada tipo de 
neurénio, reunindo depois informacdes sobre 0 modo como 
cada médulo funcional se conecta. Os métodos funcionais 
derivados desse tipo de analise podem guiar o 


desenvolvimento de sistemas inteligentes. Basicamente, 
estamos procurando métodos inspirados biologicamente que 
podem acelerar o trabalho na IA, boa parte da qual 
progrediu sem um /nsight significativo sobre o modo como o 
cérebro realiza funcdes similares. A julgar por meu proprio 
trabalho com o reconhecimento de fala, sei que nosso 
trabalho avancgou bastante quando percebemos como o 
cérebro prepara e transforma a informacao auditiva. 

As estruturas macicamente redundantes do cérebro se 
diferenciam através do aprendizado e da experiéncia. A 
atual vanguarda na IA também permite, com efeito, que os 
sistemas aprendam com sua propria experiéncia. OS carros 
autodirigidos do Google aprendem com _ sua_ propria 
experiéncia de conducao, bem como com os dados de carros 
do Google dirigidos por motoristas humanos; Watson 
aprendeu a maior parte de seus conhecimentos lendo por 
conta prdépria. E interessante notar que os métodos usados 
hoje na IA evoluiram e sao, em termos matematicos, muito 
semelhantes aos mecanismos do neocortex. 

Outra objecao que costuma ser oposta a viabilidade da 
‘IA forte” (inteligéncia artificial em niveis humanos ou além) 
€ que o cérebro humano usa bastante a computacao 
analdgica, enquanto métodos digitais nao podem replicar 
intrinsecamente aS gradagodes de valor que as 
representacdes analdgicas podem incorporar. E verdade que 
um bit pode estar ligado ou desligado, mas palavras com 
muitos bits podem _ representar facilmente gradacoes 
multiplas, e podem fazé-lo com qualquer grau de precisao 
desejado. Naturalmente, isso é feito o tempo todo em 
computadores digitais. Tal como esta, a precisao da 
informacao analdgica no cérebro (como a for¢a sinaptica, por 


exemplo) @€ apenas um dos 256 niveiS que pode ser 
representado por oito bits. 

No capitulo 9, citei a objecao de Roger Penrose e Stuart 
Hameroff sobre microtubulos e computagao quantica. 
Lembre-se de que eles alegaram que as estruturas dos 
microtubulos nos neurdénios estao realizando computacao 
quantica e, como nao é_ possivel fazer isso em 
computadores, o cérebro humano é fundamentalmente 
diferente e presumivelmente melhor. Como disse antes, nao 
ha evidéncia de que os microtubulos neuronais estejam 
realizando computacao quantica. Com efeito, os humanos 
fazem um péssimo trabalho para solucionar os problemas 
nos quaiSs um computador quantico seria excelente (como a 
fatoracao de numeros grandes). E, se qualquer dessas coisas 
se mostrasse real, nao haveria nada que impedisse a 
computacao quantica de também ser usada em nossos 
computadores. 

John Searle ficou famoso por introduzir um experimento 
mental que ele chama de “quarto chinés”, que tratei em 
detalhes em The singularity is near [9]. Em sintese, envolve 
um homem que recebe perguntas escritas em chinés e 
depois as responde. Para fazé-lo, ele usa um complexo livro 
de regras. Searle alega que o homem nao compreende 
chinés e nao esta “consciente” da linguagem (pois nao 
compreende as perguntas ou as respostas), apesar de sua 
aparente capacidade de responder a perguntas em chinés. 
Searle compara a situagao a um computador e conclui que 
um computador que pode responder a perguntas em chinés 
(basicamente, passando por um teste de Turing em chinés), 
nao teria, como o homem no quarto chinés, como 
compreender de fato a linguagem e nao teria nocao do que 
estaria fazendo. 





Ha alguns truques filosdéficos no argumento de Searle. 
Acontece que 0 homem nesse experimento mental sd é 
comparavel a CPU (unidade central de processamento) de 
um computador. Podemos dizer que uma CPU nao 
compreende de fato 0 que esta fazendo, que a CPU é apenas 
parte da estrutura. No quarto chinés de Searle, o homem 
com seu livro de regras é o sistema inteiro. Esse sistema 
entende chinés; do contrario, nao seria capaz de apresentar 
respostas convincentes para perguntas em chinés, o que 
violaria a premissa de Searle para esse experimento mental. 

A atratividade do argumento de Searle deriva do fato de 
que hoje é dificil inferir compreensao e consciéncia reais 
num programa de computador. O problema com seu 
argumento, porém, € que vocé pode aplicar sua propria 
linha de raciocinio ao prdprio cérebro humano. Cada 
identificador neocortical de padroes - na verdade, cada 
neur6nio e cada componente neuronal - esta seguindo um 
algoritmo. (Afinal, sao mecanismos moleculares que seguem 
leis naturais.) Se concluirmos que o ato de seguir um 
algoritmo é inconsistente com compreensao e consciéncia 
reais, entao teremos de concluir também que o cérebro 
humano nao exibe essas qualidades. Vocé pode usar o 
argumento do quarto chinés de John Searle e simplesmente 
substituir “manipulando conexodes interneuronais e forcas 
sinapticas” pelas palavras usadas por ele, “manipulando 
simbolos”, para ter um argumento convincente de que, na 
verdade, o cérebro humano nao consegue compreender 
nada. 

Outra linha de argumentacao vem da natureza, que se 
tornou um novo solo sagrado para muitos observadores. Por 
exemplo, o bidlogo neozelandés Michael Denton (nascido 
em 1943) vé uma diferenca profunda entre os principios de 


design das maquinas e os da biologia. Denton escreve que 
as entidades naturais Sao “auto-organizadas... 
autorreferentes... autorreplicantes... reciprocas... 
autoformativas e... holisticas [10]”. Ele afirma que tais 
formas biolégicas s6 podem ser criadas através de processos 
bioldgicos e que portanto essas formas sao realidades 
“imutaveis,... impenetraveis ee... fundamentais” da 
existéncia, sendo, portanto, uma _ categoria filosdfica 
basicamente diferente da categoria das maquinas. 

A realidade, como vimos, 6 que aS maquinas podem ser 
desenhadas usando esses mesmos principios. Aprender os 
paradigmas especificos de design da entidade mais 
inteligente da natureza - o cérebro humano - é exatamente 
O propdsito do projeto de engenharia reversa do cérebro. 
Também nao é verdade que os sistemas bioldgicos sao 
completamente “holisticos”, como afirma Denton, e nem, por 
outro lado, que aS maquinas precisam ser completamente 
modulares. Identificamos claramente hierarquias de 
unidades de_ funcionalidade em_ sistemas naturais, 
especialmente o cérebro, e sistemas de IA estao usando 
métodos comparaveis. 

Para mim, parece que muitos criticos nao _ ficarao 
satisfeitos enquanto os computadores nao passarem 
rotineiramente pelo teste de Turing, mas até esse limiar nao 
sera absolutamente claro. Sem duvida, havera controvérsias 
quanto a validade dos testes de Turing supostamente 
aplicados. De fato, provavelmente eu serei um dos criticos a 
fazer afirmacgoes similares. Quando os argumentos sobre a 
validade de computadores que passam pelo teste de Turing 
estiverem mais assentados, ha muito os computadores terao 
ultrapassado a inteligéncia humana sem reforcos. 


Enfatizo aqui a expressao “sem reforcos”, pois o reforco é 
justamente o motivo para estarmos criando essas “criancas 
mentais”, como Hans Moravec as chama [11]. Combinar a 
identificagcao de padroes de nivel humano com a velocidade 
€ a precisao inerentes dos computadores vai resultar em 
habilidades muito poderosas. Mas essa nao é a invasao 
alienigena de maquinas inteligentes de Marte: estamos 
criando essas ferramentas para nos tornar mais espertos. 
Creio que a maioria dos observadores vai concordar comigo 
que é isto que torna a espécie humana unica: construimos 
essas ferramentas para ampliar nosso alcance. 


¢ Epilogo » 


O cenario esta bem feio, senhores... O clima do planeta esta 
mudando, os mamiferos estado dominando e temos cérebros do 
tamanho de uma noz. 

- Dinossauros falando em The Far Side, de Gary Larson 


intelig@ncia pode ser definida como a capacidade de 
yA eleaae problemas com recursos limitados, dentre os 
quais um dos principais 6 o tempo. Logo, a capacidade de 
resolver um problema mais rapidamente, como encontrar 
comida ou escapar de um predador, reflete um poder 
intelectual maior. A inteligéncia se desenvolveu porque era 
util para a sobrevivéncia, um fato que pode parecer dbvio, 
mas com 0 qual nem todos concordam. Da forma como tem 
sido praticada por nossa espécie, ela permitiu nao apenas 
que dominassemos o planeta, como melhorassemos cada 
vez maiS nossa qualidade de vida. Este ultimo ponto 
também nao fica aparente para todos, uma vez que ha uma 
percepcao disseminada de que a vida esta ficando pior. Para 
citar um exemplo, uma pesquisa do Gallup divulgada em 4 
de maio de 2011 revelou que apenas “44% dos norte- 
americanos acreditam que a juventude atual tera uma vida 
melhor do que a de seus pais [1]”. 

Se olharmos para as tendéncias mais amplas, nao sé a 
expectativa de vida humana quadruplicou no ultimo milénio 
(e mais do que dobrou nos dois ultimos séculos [2]), como o 
PIB per capita (em ddédlares atuais constantes) passou de 


centenas de ddlares em 1800 para milhares de dolares hoje, 
com tendéncias ainda mais acentuadas no mundo 
desenvolvido [3]. S6 havia um punhado de democracias ha 
um século, enquanto hoje elaS sao a norma. Para uma 
perspectiva historica dos avancos que fizemos, sugiro que as 
pessoas leiam Leviata (1651), de Thomas Hobbes, no qual 
ele descreve a “vida do homem” como “solitaria, pobre, 
dura, brutal e breve”. Para uma perspectiva moderna, o 
recente livro Abundancia (2012), do fundador da X-Prize 
Foundation (e cofundador, comigo, da _ Singularity 
University), Peter Diamandis, e do autor de ciéncia Steven 
Kotler, documenta de que maneiras extraordinarias a vida 
atual melhorou firmemente em todas as dimensoes. O 
recente livro de Steven Pinker, Os anjos bons da nossa 
natureza: por que a violéncia diminuiu [Better angels of our 
nature: why violence has declined] (2011), documenta 
minuciosamente um aumento constante nas_ relacdes 
pacificas de um povo e entre povos. A advogada, 
empreendedora e autora norte-americana Martine Rothblatt 
(nascida em 1954) documenta a firme melhoria nos direitos 
civis, observando, por exemplo, como o casamento entre 
pessoas do mesmo sexo passou, em duas décadas, de uma 
situacgao na qual nenhum lugar do mundo o reconhecia, para 
a aceitacao legal num numero de jurisdicdes que cresce 
rapidamente [4]. 

Um dos motivos basicos para as pessoas acharem que a 
vida esta piorando € que conhecemos cada vez mais os 
problemas do mundo. Se acontecer uma batalha hoje em 
algum lugar do planeta, nds a vivenciaremos quase como se 
estivéssemos la. Durante a Segunda Guerra Mundial, 
dezenas de milhares de pessoas podiam morrer num 
combate, e, se o publico chegava a saber disso, era através 


de um esfumacado noticiario do cinema, semanas depois. 
Na Primeira Guerra Mundial, uma pequena elite conseguia 
Saber o progresso do conflito num jornal (sem fotos). No 
século 19, quase nao existia 0 acesso a noticias em tempo 
habil. 

O progresso que fizemos como espécie em funcao de 
nossa intelig@ncia se reflete na evolugao de nosso 
conhecimento, que inclui nossa tecnologia e nossa cultura. 
Nossas diversas tecnologias estao se tornando cada vez 
mais tecnologias da _ informacgao, que  continuam 
intrinsecamente a progredir de forma exponencial. Gracas a 
essas tecnologias € que pudemos tratar dos grandes 
desafios da humanidade, como a manutencao de um 
ambiente saudavel, a oferta de recursos para uma 
populacao crescente (inclusive energia, alimentos e agua), 
superar doencas, estender bastante a longevidade humana 
e eliminar a pobreza. S6 com nossa extensao pelo uso de 
tecnologias inteligentes € que podemos lidar com a escala 
de complexidade necessaria para enfrentar esses desafios. 

Essas tecnologias nao sao a vanguarda de uma invasao 
inteligente que vai competir conosco, substituindo-nos 
enfim. Desde que pegamos um graveto para chegar até um 
galho mais alto, temos usado ferramentas para ampliar 
nosso alcance, tanto fisico como mental. O fato de podermos 
tirar um aparelho do bolso e acessar boa parte do 
conhecimento Nhumano mediante a pressao de algumas 
teclas estende nosso alcance além de qualquer coisa 
imaginavel pela maioria dos observadores ha nao muitas 
décadas. O “telefone celular” (pus a expressao entre aspas 
porque ele é muito mais do que um telefone) em meu bolso 
€ um milhao de vezes menos caro, mas milhares de vezes 
mais poderoso do que o computador que todos os alunos e 


professores do MIT usavam quando eu estudava la. Houve 
um aumento de varios bilhdes de vezes na _ relacao 
preco/desempenho nos ultimos 40 anos, uma escalada que 
continuaremos a ver nos préximos 25 anos, quando aquilo 
que costumava caber num edificio, e hoje cabe no seu bolso, 
podera caber numa célula sanguinea. 

Desse modo, vamos nos fundir com aé tecnologia 
inteligente que estamos criando. Nanobots inteligentes em 
nossa corrente sanguinea vao manter nosso corpo biolégico 
saudavel nos niveis celular e molecular. Eles vao entrar em 
nosso cérebro de maneira nao invasiva pelos vasos 
capilares, e vao interagir com nossos neurdénios bioldgicos, 
estendendo diretamente a nossa intelig@ncia. Isso nao é tao 
futurista quanto pode parecer. Ja existem aparatos do 
tamanho de células sanguineas que podem curar o diabetes 
tipo | em animais ou detectar e destruir células cancerigenas 
na corrente sanguinea. Com base na lei dos retornos 
acelerados, essas tecnologias serao um bilhao de vezes mais 
poderosas dentro de trés décadas do que sao hoje. 

Eu ja considero que os aparelhos que uso, e a nuvem de 
recursos de informatica a qual eles estao conectados 
virtualmente, sao extensoes de mim mesmo, e me sinto 
menos do que completo se fico isolado dessas extensdes do 
cérebro. E por isso que a greve de um dia feita pelo Google, 
a Wikipédia e milhares de outros sites da Internet contra o 
SOPA (Stop Online Piracy Act, ou Lei contra a pirataria on- 
line), em 18 de janeiro de 2012, foi tao notavel: senti-me 
como se parte de meu cérebro estivesse entrando em greve 
(embora eu e outras pessoas tenhamos encontrado maneiras 
de acessar esses recursos on-line). Também foi uma 
demonstracao impressionante do poder politico desses sites, 
pois a lei - que aparentemente seria ratificada - foi retirada 


imediatamente de votacao. Mais importante ainda é o fato 
de isso ter mostrado até que ponto ja terceirizamos parte de 
nosso modo de pensar através da nuvem da computacao. 
Ela ja faz parte de quem somos. Depois que tivermos 
inteligéncia nao biolégica inteligente em nossos cérebros, a 
Capacidade dessa ampliacao - e€ a nuvem a qual esta 
conectada - vai continuar a crescer exponencialmente. 

A inteligéncia que criaremos com o processo de 
engenharia reversa do cérebro tera acesso a seu proprio 
cédigo-fonte e sera capaz de se aprimorar rapidamente num 
ciclo de design iterativo e acelerado. Apesar de haver 
consideravel plasticidade no cérebro humano bioldgico, 
como vimos, ele tem uma arquitetura relativamente fixa, 
que nao pode ser modificada significativamente, bem como 
uma capacidade limitada. Nao podemos aumentar seus 300 
milhoes de identificadores de padroes para 400 milhoes, 
digamos, a menos que o facamos de maneira nao bioldgica. 
Apos termos conseguido isso, nao havera motivo para nos 
determos num nivel especifico de capacidade. Podemos 
prosseguir e ter um bilhao de identificadores de padroes, ou 
um trilhdo. 

Da melhoria quantitativa vem o avancgo qualitativo. O 
avanco evolutivo mais importante do Homo sapiens foi 
quantitativo: o desenvolvimento de uma testa maior para 
acomodar mais neocdrtex. O aumento da capacidade 
neocortical permitiu que essa nova espécie criasse e 
contemplasse pensamentos em_ niveis — conceituais 
Superiores, resultando no estabelecimento de todos os 
diversos campos da arte e da ciéncia. A medida que 
acrescentamos mais neocdértex em forma nao bioldgica, 
podemos esperar niveis qualitativos de abstracao cada vez 
mais elevados. 


O matematico inglés Irvin J. Good, colega de Alan Turing, 
escreveu em 1965 que “a primeira maquina ultrainteligente 
é€ a ultima invengao que o homem precisara fazer”. Ele 
definiu. tal maquina, dizendo que ela superaria “as 
atividades intelectuais de qualquer homem, por mais 
inteligente que fosse”, concluindo que “como o projeto de 
maquinas @ uma dessas atividades intelectuais, uma 
maquina ultrainteligente poderia projetar maquinas ainda 
melhores; inquestionavelmente, haveria uma ‘explosao de 
intelig@ncia’”. 

A ultima invencao que a evolucao biolédgica precisou 
fazer - o neocdrtex - esta levando inevitavelmente a ultima 
invengao que a humanidade precisa fazer - maquinas 
realmente inteligentes - e o projeto de uma inspira a outra. 
A evolucao bioldgica vai continuar, mas a _ evolucao 
tecnoldgica esta se movendo um milhao de vezes mais 
depressa do que a outra. Segundo a lei dos retornos 
acelerados, no final deste século seremos capazes de criar a 
computacao nos limites do possivel, com base nas leis da 
fisica aplicadas a computacao [5]. Damos a matéria e a 
energia organizadas dessa forma oO nome de 
“computronium”, que @ muito mais poderoso, quilo por 
quilo, do que o cérebro humano. Nao sera apenas a 
computacgao simples, mas algo repleto de algoritmos 
inteligentes que constituem todo o conhecimento do homem 
e da maquina. Com o tempo, teremos convertido boa parte 
da massa e da energia de nosso pequeno recanto da galaxia 
adequados para esse propdsito em computronium. Entao, 
para manter em funcionamento a lei dos_ retornos 
acelerados, preciSsaremos nos espalhar para o resto da 
galaxia e do universo. 


Se a velocidade da luz se mantiver efetivamente como 
limite inexoravel, entao a colonizacao do universo vai 
demorar muito, tendo em vista que o sistema estelar mais 
proximo da Terra fica a quatro anos-luz de distancia. Se 
existirem meios ainda mais sutiS para superar esse limite, 
nossa inteligéncia e nossa tecnologia serao poderosas o 
suficiente para explora-los. Esse € um motivo pelo qual a 
recente sugestao de que os muons que atravessaram os 730 
quildmetros do acelerador CERN na fronteira franco-suica 
até o Gran Sasso Laboratory no centro da Italia parecem ter 
se movido mais depressa do que a velocidade da luz foi uma 
noticia potencialmente significativa. Essa observagcao em 
particular parece ter sido um alarme falso, mas ha outras 
possibilidades para contornarmos' esse_ limite. Nao 
precisamos nem exceder a velocidade da luz se pudermos 
encontrar atalhos para lugares aparentemente distantes 
através de dimens6des espaciais além das trés com que 
estamos familiarizados. A principal questao estratégica da 
civilizag¢ao homem-maquina do comeco do século 22 sera: 
seremos capazes de superar a velocidade da luz ou de 
contornarmos seu limite? 

Os cosmologistas se perguntam se 0 mundo vai terminar 
em fogo (uma grande fogueira para combinar com o Big 
Bang) ou em gelo (a morte das estrelas, na medida em que 
se afastam numa grande expansao), mas isso nao leva em 
conta o poder da inteligéncia, como se seu aparecimento 
fosse apenas um divertido espetaculo secundario para a 
grandiosa mecanica celeste que hoje governa o universo. 
Quanto tempo vai levar até espalharmos nossa intelig@éncia 
em forma nao biolédgica pelo universo? Se pudermos 
transcender a velocidade da luz - e devemos admitir que 
esse € um grande se - usando, por exemplo, buracos de 


minhoca através do espaco (que sao consistentes com nossa 
atual compreensao da fisica), isso pode ser feito dentro de 
alguns séculos. Do contrario, 6 provavel que leve muito mais 
tempo. Em qualquer desses cenarios, fazer despertar o 
universo, decidindo depois sua sina de maneira inteligente, 
infundindo nele nossa inteligéncia humana em sua forma 
nao bioldgica, 6 nosso destino. 


e Notas ° 


Introducao 
1. Eis um trecho de Cem anos de solidao, de Gabriel Garcia Marquez: 


Aureliano Segundo nao tomou consciéncia da ladainha até o dia seguinte depois do 
café quando se sentiu aturdido por um zumbido que ja estava mais fluido e mais alto 
que o barulho da chuva e era Fernanda que passeava pela casa inteira se lamentando 
de que a tivessem educado como uma rainha para acabar de criada numa casa de 
loucos, com um marido vagabundo, iddlatra, libertino, que ficava de papo para o ar 
esperando que chovesse pao do céu, enquanto ela destroncava os rins tentando manter 
a tona um lar preso com alfinetes, onde tinha tanto que fazer, tanto que aguentar e 
corrigir, desde que amanhecia o Senhor até a hora de dormir, que ja chegava na cama 
com os olhos vidrados, e no entanto nunca ninguém Ihe dera um bom dia, Fernanda, 
como passou a noite, Fernanda? nem lhe perguntara, mesmo que fosse sé por 
delicadeza, por que estava tao palida nem por que se levantava com essas olheiras 
roxas, apesar de ela nao esperar, é claro, que aquilo saisse do resto de uma familia que 
afinal de contas sempre a considerara como um estorvo, como o pegador de panelas, 
como uma bruxinha de pano pendurada na parede, e que sempre andavam 
tresvariando contra ela pelos cantos, chamando-a de santarrona, chamando-a de 
fariseia, chamando-a de velhaca, e até Amaranta, que Deus tenha, havia dito a viva voz 
que ela era das que confundiam o reto com as témporas, bendito seja Deus que 
palavras, e ela aguentara tudo com resignacao pelas intencdes do Santo Pai, mas nao 
pudera suportar mais quando o malvado do José Arcadio Segundo disse que a perdicao 
da familia tinha sido abrir as portas para uma franguinha, imaginem, uma franguinha 
mandona, valha-me Deus, uma franguinha filha de ma saliva, da mesma indole dos 
frangotes que o Governo tinha mandado para matar os trabalhadores, veja vocé, e se 
referia nada mais nada menos do que a ela, a afilhada do Duque de Alba, uma dama de 
tanta classe que deixava as esposas dos presidentes no chinelo, uma fidalga de sangue 
como ela que tinha o direito de assinar onze sobrenomes peninsulares e que era o Unico 
mortal desse povoado de bastardos que nao se sentia atrapalhado diante de dezesseis 
talheres, para que logo o adultero do seu marido dissesse morrendo de rir que tantas 
colheres e garfos, e tantas facas e colherinhas, nao eram coisa de cristao, mas de 
centopeia, e a Unica que podia dizer de olhos fechados quando se servia o vinho 
branco, e de que lado, em que taca, e quando se servia o vinho tinto, e de que lado, e 
em que tac¢a, e nao como a rustica da Amaranta, que em paz descanse, que pensava 
que o vinho branco se servia de dia e 0 vinho tinto de noite, e a Unica em todo o litoral 


que podia se vangloriar de nao se ter aliviado a nao ser em penicos de ouro, para que 
em seguida o Coronel Aureliano Buendia, que em paz descanse, tivesse o atrevimento 
de perguntar com os seus maus bofes de macom a troco de que tinha merecido esse 
privilégio, por acaso ela nado cagava merda, e sim orquideas?, imaginem, com essas 
palavras, e para que Renata, sua propria filha, que por indiscricdo tinha visto 0 seu 
numero dois no quarto, respondesse que realmente o penico era de muito ouro e de 
muita heraldica, mas o que tinha dentro era pura merda, merda fisica, e pior ainda que 
as outras, porque era merda de gente metida a besta, imaginem, a sua propria filha, de 
modo que nunca tivera ilusées com o resto da familia, mas de qualquer maneira tinha o 
direito de esperar um pouco mais de consideracdao da parte do marido, ja que bem ou 
mal era o seu cénjuge de sacramento, o seu autor, 0 seu legitimo prejudicador, que se 
encarregara por livre e espontanea vontade da grave responsabilidade de tira-la do 
solar paterno, onde nunca se privara de nada nem sofrera por nada, onde tecia coroas 
funebres por pura diversao, ja que seu padrinho tinha mandado uma carta com a sua 
assinatura e o selo do seu anel impresso no lacre, sé para dizer que as maos da afilhada 
nao tinham sido feitas para os trabalhos deste mundo que nao fossem tocar clavicérdio 
e, entretanto, o insensato do marido a tirara de casa, com todas as admoestacoes e 
adverténcias, e a trouxera para aquela caldeira do inferno onde nao se podia respirar de 
tanto calor, e antes que ela acabasse de guardar as suas abstinéncias de Pentecostes, 
ja tinha ido embora com os seus bats migratérios e 0 seu acordeao de perdulario para 
gozar em adultério com uma desgracada de quem bastava olhar as nadegas, bem, ja 
estava dito, de quem bastava olhar as nadegas de potranca para adivinhar que era 
uma, que era uma, exatamente o contrario dela, que era uma dama no palacio ou na 
pocilga, na mesa ou na cama, uma dama de nascenca, temente a Deus, obediente as 
suas leis e submissa aos seus designios, e com quem nao podia fazer, é claro, as 
nojeiras e vagabundagens que fazia com a outra, que 6 claro que se prestava a tudo, 
como as matronas francesas, e pior ainda, pensando bem, porque estas pelo menos 
tinham a honradez de colocar uma luz vermelha na porta, semelhantes porcarias, 
imaginem, so faltava essa, com a filha Unica e bem-amada de D. Renata Argote e D. 
Fernando del Carpio, e sobretudo deste, é claro, um santo varao, um cristao dos 
grandes, Cavaleiro da Ordem do Santo Sepulcro, desses que recebem diretamente de 
Deus o privilégio de se conservarem intactos na cova, com a pele esticada como cetim 
de noiva e os olhos vivos e didafanos como as esmeraldas. 


2. Ver o grafico “Aumento na Sequéncia de Dados do DNA no Genbank”, no capitulo 10. 


3. Cheng Zhang e Jianpeng Ma, “Enhanced Sampling and Applications in Protein Folding in 
Explicit Solvent”, Journal of Chemical Physics 132, n. 24 (2010): 244101. Ver 
tambémhttp://folding.stanford.edu/English/sobre o projeto Folding@home, que uniu mais 
de 5 milhées de computadores ao redor do mundo para simular a dobra de proteinas. 





4. Para uma descrigao mais completa deste argumento, ver a secao “[The Impact...] on the 
Intelligent Destiny of the Cosmos: Why We Are Probably Alone in the Universe”, no 


capitulo 6 de The singularity is near, de Ray Kurzweil (Nova York: Viking, 2005). 


5. James D. Watson, Discovering the Brain (Washington, DC: National Academies Press, 
1992). 


6. Sebastian Seung, Connectome: How the Brain’s Wiring Makes Us Who We Are (Nova 
York: Houghton Mifflin Harcourt, 2012). 


7. “Mandelbrot Zoom”, http://www.youtube.com/watch?v=gEw8xpbiaRA; “Fractal Zoom 
Mandelbrot Corner”, http://www.youtube.com/watch? v=G_GBwuYuOOs. 


Capitulo 1: Experimentos mentais pelo mundo 
1. Charles Darwin, The Origin of Species (P. F. Collier & Son, 1909), 185/ 95-96. 


2. Darwin, On the Origin of Species, 751 (206. 1. 1-6), edi¢ado Variorum de Peckham, 
organizada por Morse Peckham, The Origin of Species by Charles Darwin: A Variorum Text 
(Filadélfia: University of Pennsylvania Press, 1959). 


3. R. Dahm, “Discovering DNA: Friedrich Miescher and the Early Years of Nucleic Acid 
Research”, Human Genetics 122, n. 6 (2008): 565-81, doi:10.1007/s00439-007-0433-0; 
PMID 17901982. 


4. Valery N. Soyfer, “The Consequences of Political Dictatorship for Russian Science”, Nature 
Reviews Genetics 2, n. 9 (2001): 723-29, doi:10.1038/35088598; PMID 11533721. 


5. J. D. Watson e F. H. C. Crick, “A Structure for Deoxyribose Nucleic Acid”, Nature 171 
(1953): 737-38, http://www.nature.com/nature/dna50/watsoncrick.pdf e “Double Helix: 50 
Years of DNA”, arquivo da Nature, http://www.nature.com/nature/dna50/archive.html. 


6. Franklin morreu em 1958 e o Prémio Nobel pela descoberta do DNA foi outorgado em 
1962. Ha controvérsias quanto a ela dever ou nao ter compartilhado esse prémio se 
estivesse viva em 1962. 


7. Albert Einstein, “On the Electrodynamics of Moving Bodies” (1905). Esse trabalho 
estabeleceu a teoria especial da relatividade. Ver Robert Bruce Lindsay e Henry 
Margenau, Foundations of Physics (Woodbridge, CT: Ox Bow Press, 1981), 330. 


8. “Crookes radiometer”, Wikipédia, http://en.wikipedia.org/wiki/Crookes_ radiometer. 


9. Perceba que parte do momento do féton é transferida para as moléculas de ar no bulbo 
(pois nado é um vacuo perfeito) e depois transferida das moléculas de ar aquecidas para a 
pa. 

10. Albert Einstein, “Does the Inertia of a Body Depend Upon Its Energy Content?” (1905). 
Este trabalho deu origem a famosa férmula de Einstein, E = mc2. 


11. ‘Albert Einstein's Letters to President Franklin Delano 


Roosevelt” ,http://hypertextbook.com/eworld/einstein.shtml. 


Capitulo 3: Um modelo do neocértex: a teoria da mente baseada 
em reconhecimento de padroes 


1. Ha relatos de que alguns animais nado mamiferos, como corvos, papagaios e polvos, sao 
capazes de demonstrar certo nivel de raciocinio; todavia, isso é limitado e nao tem sido 
suficiente para criarem ferramentas que mostrem seu prdprio curso evolutivo de 
desenvolvimento. Esses animais podem ter adaptado outras regides do cérebro para 
realizar um pequeno numero de niveis de pensamento hierarquico, mas é preciso um 
neocortex para o pensamento hierarquico relativamente irrestrito que os humanos podem 
manter. 


2.\V. B. Mountcastle, “An Organizing Principle for Cerebral Function: The Unit Model and the 
Distributed System” (1978), in Gerald M. Edelman e Vernon B. Mountcastle, The Mindful 
Brain: Cortical Organization and the Group-Selective Theory of Higher Brain Function 
(Cambridge, MA: MIT Press, 1982). 


3. Herbert A. Simon, “The Organization of Complex Systems”, in Howard H. Pattee, ed., 
Hierarchy Theory: The Challenge of Complex Systems (Nova York: George Braziller, Inc., 
1973), http://blog.santafe.edu/wp-content/uploads/2009/03/simon1973.pdf. 


4. Marc D. Hauser, Noam Chomsky e W. Tecumseh Fitch, “The Faculty of Language: What Is 
It, Who Has It, and How Did It Evolve?” Science 298 (novembro de 2002): 1569- 
79,http://www.sciencemag.org/content/298/5598/1569.short. 


5. O seguinte trecho do livro Transcend: Nine Steps to Living Well Forever, de Ray Kurzweil 
e Terry Grossman (Nova York: Rodale, 2009), descreve esta técnica de sonho lucido com 
mais detalhes: 





Desenvolvi um método para resolver problemas enquanto durmo. Aperfeicoei-o para 
meu uso ao longo de varias décadas e aprendi os meios sutis pelos quais ele pode 
funcionar melhor. 

Comeco postulando um problema quando vou para a cama. Pode ser qualquer tipo de 
problema. Pode ser um problema de matematica, algum problema com uma de minhas 
invengdes, uma questao de estratégia de negdcios, ou mesmo um problema 
interpessoal. 

Penso no problema durante alguns minutos, mas ndo tento resolvé-lo. Isso impediria 
que aparecesse a solucdo criativa do problema. Eu tento pensar nele. O que sei a 
respeito do assunto? Que forma a solucao poderia assumir? E vou dormir. Ao fazé-lo, 
preparo a mente subconsciente para trabalhar no problema. 

Terry: Sigmund Freud disse que, quando sonhamos, muitos dos censores do cérebro 
ficam relaxados para que possamos sonhar com coisas que sao tabu, social, cultural ou 


mesmo sexual. Podemos sonhar com coisas estranhas sobre as quaiS nao nos 
permitiriamos pensar durante o dia. No minimo, essa é uma razao para os sonhos serem 
estranhos. 

Ray: Ha ainda obstaculos profissionais que impedem as pessoas de pensarem 
criativamente, e muitos provém de nosso treinamento profissional; sao blocos mentais 
como “vocé nao pode resolver um problema de processamento de sinais dessa 
maneira”, ou “a linguistica nado deveria usar estas regras”. Essas suposicées mentais 
também sdo relaxadas em nosso estado onirico, por isso eu sonho com novas maneiras 
de resolver problemas sem ficar sobrecarregado pelas limitacdes do dia a dia. 

Terry: Ha outra parte de nosso cérebro que também nao trabalha quando sonhamos: 
a nossa faculdade racional para avaliar se uma ideia é razoavel. Esse € mais um motivo 
pelo qual coisas estranhas ou fantasticas acontecem em nossos sonhos. Quando o 
elefante atravessa a parede, nao ficamos chocados imaginando como o elefante 
conseguiu fazer isso. S6 dizemos para o nosso eu onirico: “Certo, um elefante 
atravessou a parede, grande coisa”. Com efeito, se eu acordar no meio da noite, 
costumo achar que estive sonhando de formas estranhas e obliquas sobre o problema 
que reservei. 

Ray: A etapa seguinte acontece pela manha, no estado intermedidrio entre o sonho e 
a vigilia, que costuma ser chamado de sonho /ucido. Nesse estado, ainda tenho as 
sensacoes e as imagens dos meus sonhos, mas agora disponho de minhas faculdades 
racionais. Percebo, por exemplo, que estou numa cama. E eu poderia formular o 
pensamento racional de que preciso fazer muita coisa, e por isso devo pular da cama. 
Mas isso seria um erro. Sempre que posso, fico na cama e continuo nesse estado de 
sonho lucido, pois essa € a chave deste método de solucao de problemas. Por falar 
nisso, o método nao vai funcionar caso o despertador toque. 

Leitor: Parece ser o melhor dos dois mundos. 

Ray: Exatamente. Ainda tenho acesso aos pensamentos ocorridos no sonho sobre o 
problema que separei na noite anterior. Mas agora ja estou suficientemente consciente 
e racional para avaliar as novas ideias criativas que me ocorreram durante a noite. 
Posso determinar quais delas fazem sentido. Apds uns 20 minutos disso, 
invariavelmente tenho novos insights sobre o problema. 

Inventei coisas dessa maneira (e passei o resto do dia redigindo o pedido da patente), 
percebi como organizar material para um livro como este, e encontrei ideias uteis para 
uma variedade de problemas. Se preciso tomar uma decisao importante, sempre passo 
por este processo, e depois tenho muita confianga em minha decisao. 

A chave para o processo é deixar sua mente livre, nado julgar e nado se preocupar se o 
processo esta funcionando bem ou no. E 0 oposto de uma disciplina mental. Pense no 
problema, mas depois deixe as ideias se espalharem por vocé enquanto adormece. Pela 
manha, deixe sua mente solta novamente, revendo as estranhas ideias geradas por 
seus sonhos. Descobri que esse método é excelente para canalizar a criatividade 
natural de meus sonhos. 

Leitor: Bem, para os workaholics de plantao, agora é possivel trabalhar nos sonhos. 
Nao sei se minha esposa vai gostar disso. 


Ray: Na verdade, vocé pode dizer que esta fazendo seus sonhos trabalharem para 
voce, 
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9. Eis o esquema basico para um algoritmo de rede neural. Muitas variacdes sao possiveis, e 
o projetista do sistema precisa apresentar certos pardmetros e métodos criticos, 
detalhados nas paginas a seguir. 


Criar uma solugado para um problema através de uma rede neural envolve as 
seguintes etapas: 
Definir 0 input. 
Definir a topologia da rede neural (i.e., as camadas de neurdénios e as conexdes 
entre os neurdénios). 
Treinar a rede neural com exemplos do problema. 
Executar a rede neural treinada para resolver novos exemplos do problema. 
Levar ao publico a empresa de sua rede neural. 
Essas etapas (exceto pela ultima) estao detalhadas a seguir: 


O input do problema 


O input do problema na rede neural consiste em uma série de numeros. Esse input 
pode ser: 


Num sistema de identificacao de padrées, uma fileira bidimensional de numeros 
representando os pixels de uma imagem; ou 


Num sistema de identificacao auditivo (p. ex., fala), uma fileira bidimensional 
de numeros representando um som, na qual a primeira dimensdo representa 
parametros do som (p. ex., Componentes de frequéncia) e a segunda dimensao 
representa pontos diferentes no tempo; ou 

Num sistema de identificagao de padrées arbitrdario, uma fileira n-dimensional 
de numeros representando o padrao de input. 


Definindo a topologia 
Para montar a rede neural, a arquitetura de cada neurdnio consiste em: 


Inputs multiplos, nas quais cada input esta “conectado” ou com o output de 
outro neurénio, ou com um dos numeros de input. 

Geralmente, um output Unico, conectado ou ao /nput de outro neurdnio 
(geralmente de uma camada Superior) ou ao output final. 


Estabelecer a primeira camada de neur6énios 

Crie No neurdénios na primeira camada. Para cada um desses neurénios, 
“conecte” cada um dos inputs multiplos do neurénio a “pontos” (ou sea, 
numeros) no input do problema. Essas conexédes podem ser determinadas 
aleatoriamente ou usando um algoritmo evolutivo (ver abaixo). 

Atribua uma “forca sinaptica” inicial para cada conexao criada. Os pesos 
atribuidos podem ter o mesmo valor inicial, podem ser atribuidos aleatoriamente 
ou podem ser determinados de outra forma (ver a seguir). 


Estabelecer as camadas adicionais de neurénios 

Forme um total de M camadas de neurénios. Em cada camada, monte os neurénios 
dessa camada. 

Para a camada;: 


Crie N; neurénios na camada;. Em cada um desses neurdnios, “conecte” cada 
um dos multiplos inputs do neurénio aos outputs dos neurdénios na camad@;.; (ver 
variagoes abaixo). 

Atribua uma “forca sinaptica” inicial para cada conexao criada. Os pesos 
atribuidos podem ter o mesmo valor inicial, podem ser atribuidos aleatoriamente 
ou podem ser determinados de outra forma (ver a seguir). 

Os outputs dos neurdnios da camaday sao os outputs da rede neural (ver 
variacdes a seguir). 


Testes de identificacao 
Como funciona cada neurénio 
Estabelecido o neurénio, ele faz o seguinte a cada teste de identificacdo: 
Cada input ponderado que chega ao neurénio é computado multiplicando-se ao 
output do outro neurénio (ou /nput inicial) com cujo input esse neurdnio esta 


conectado pela forca sinaptica dessa conexao. 

Todos esses inputs ponderados que chegam ao neurdénio sao somados. 

Se a soma for maior do que o limiar de disparo desse neurdnio, entdo se 
considera que esse neurdénio disparou e seu output 6 1. Do contrario, seu output é 
O (ver variagdoes a seguir). 


Faca o seguinte em cada teste de identificac¢ao 
Em cada camada, da camadag a camaday;: 
Em cada neurénio da camada: 


Some os inputs ponderados (cada input ponderado = o output do outro 
neurénio [ou input inicial] aos quais o input desse neurénio esta conectado, 
multiplicado pela forca sinaptica dessa conexao). 

Se a soma dos inputs ponderados for maior do que o limiar de disparo desse 
neur6énio, faga o output desse neurénio = 1; do contrario, ajuste-o para 0. 


Para treinar a rede neural 

Execute testes de identificacdao repetitivos com problemas de exemplo. 

Apos cada teste, ajuste as forcas sinapticas de todas as conexdes 
interneuronais para melhorar 0 desempenho da rede neural desse teste (ver a 
discussao a seguir sobre como fazer isto). 

Continue esse treinamento até o indice de precisdo da rede neural nao 
melhorar mais (ou seja, atingir uma assintota). 


Principais decisées de projeto 
No esquema simples indicado acima, o projetista desse algoritmo de rede neural 
precisa determinar desde o inicio: 

O que os numeros de input representam. 

O numero de camadas de neurénios. 

O numero de neurénios em cada camada. (Cada camada nao precisa ter 
necessariamente o mesmo numero de neurénios.) 

O numero de inputs de cada neurénio de cada camada. O numero de /nputs (ou 
seja, de conexdes interneuronais) também pode variar de neurénio para neurdénio 
e de camada para camada. 

A “fiagao” (ou seja, as conexdes) efetiva. Para cada neurénio de cada camada, 
ela consiste em uma lista dos outros neurénios, cujos outputs constituem os 
inputs desse neurdénio. Isso representa uma area importante do projeto. Ha 
diversas maneiras possiveis para se fazer isso: 


(1) Faca uma fiacao aleatdéria da rede neural; ou 
(2) Use um algoritmo evolutivo (ver adiante) para determinar a fiacdo ideal; ou 
(3) Use o melhor julgamento do projetista do sistema para determinar a fiacao. 


As forgas sinapticas iniciais (ou seja, pesos) de cada conexdo. Ha diversas 
maneiras de se fazer isso: 


(1) Ajuste as forcas sinapticas com o mesmo valor; ou 

(2) Ajuste as forcas sinapticas com valores aleatdérios diferentes; ou 

(3) Use um algoritmo evolutivo para determinar um conjunto ideal de valores 
iniciais; ou 

(4) Use o melhor julgamento do projetista do sistema para determinar os valores 
iniciais. 


O limiar de disparo de cada neurénio. 
Determine o output. Este pode ser: 


(1) os outputs da camadaM de neurénios; ou 

(2) 0 output de um neurénio com output Unico, cujos inputs sao os outputs dos 
neurdnios da camadaM; ou 

(3) uma funcao (p. ex., a soma) dos outputs dos neurénios na camaday; ou 

(4) outra funcao dos outputs dos neurdénios em diversas camadas. 


Determine como as forcgas sinapticas de todas as conexédes sao ajustadas 
durante o treinamento dessa rede neural. Esta € uma importante decisao de 
projeto e é alvo de muitas pesquisas e discussdes. Ha diversas maneiras para 
fazé-lo: 


(1) A cada teste de identificacao, aumente ou diminua cada forca sinaptica de um 
valor fixo (geralmente pequeno) para que o output da rede neural se aproxime 
bastante da resposta correta. Um modo de fazé-lo 6 tentar incrementar e diminuir 
e ver o que produz o efeito mais desejavel. Isso pode levar tempo, e por isso ha 
outros métodos para se tomar decisdes locais com relagdao a aumentar ou diminuir 
cada forca sinaptica. 

(2) Ha outros métodos estatisticos para modificar as forcas sindapticas apdés cada 
teste de identificagado, para que o desempenho da rede neural desse teste se 
aproxime mais da resposta correta. 


Perceba que o treinamento da rede neural vai funcionar mesmo que as 
respostas dos testes de treinamento nao estejam todas corretas. Isso permite o 
uso de dados de treinamento do mundo real que podem ter uma taxa de erros 
inerente. Uma chave para o sucesso de um sistema de identificag¢ao baseado em 
rede neural € a quantidade de dados usados para treinamento. Geralmente, 6 
necessario uSar uma quantidade bastante substancial para obter resultados 
satisfatérios. Tal como acontece com alunos humanos, o tempo empregado por 
uma rede neural no aprendizado de suas licdes é€ um fator crucial para seu 
desempenho. 


Variacdes 
Ha muitas variacdes viaveis do que apresentei acima. Por exemplo: 


Existem varias maneiras de se determinar a topologia. A fiacao interneuronal, 
em particular, pode ser determinada aleatoriamente ou usando-se um algoritmo 
evolutivo. 

Ha varias maneiras de se estabelecer as forcas sinapticas iniciais. 

Os inputs dos neurénios da camadai nao precisam vir necessariamente dos 
outputs dos neurénios da camadai-1. Alternativamente, os inputs dos 
neurénios de cada camada podem vir de qualquer camada inferior ou de 
qualquer camada. 

Ha varias maneiras de se determinar o output final. 

O método descrito acima resulta num disSparo “tudo ou nada” (1 ou 0) 
chamado de nao linearidade. Ha outras funcdes nao lineares que podem ser 
usadas. Normalmente, 6 usada uma funcdo que vai de 0 a 1 de maneira 
rapida, mas mais gradual. Além disso, os outputs podem ser numeros 
diferentes deO el. 

Os diferentes métodos de ajuste das forcas sinapticas durante o treinamento 
representam importantes decisdes do projeto. 

O esquema acima descreve uma rede neural “sincrona”, na qual cada teste 
de identificacdo é feito calculando-se os outputs de cada camada, comecando 
pela camada0 até a camadaM. Num sistema realmente paralelo, no qual cada 
neurdnio opera independentemente dos demais, os neurénios podem atuar 
“assincronamente” (ou seja, independentemente). Numa abordagem 
assincrona, cada neurdnio rastreia constantemente seus inputs e dispara 
sempre que a soma ponderada de seus /nputs excede seu limiar (OU o que sua 
funcao de output especificar). 
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11. Eis 0 esquema basico para um algoritmo genético (evolutivo). Muitas variagées sao 
possiveis, e o projetista do sistema precisa prover certos parametros e métodos criticos, 
detalhados a seguir. 





O algoritmo evolutivo 
Crie N “criaturas” de solucao. Cada uma possui: 
Um cédigo genético: uma sequéncia de numeros que caracteriza uma solucao 
possivel para o problema. Os numeros podem representar parametros criticos, 
etapas para uma solucao, regras etc. 


Para cada geracao de evolucao, faga 0 seguinte: 
Faca 0 seguinte com cada uma das Wcriaturas de solucao: 


Aplique a solucao dessa criatura de solucao (conforme representa seu cdédigo 
genético) ao problema, ou ambiente simulado. Avalie a solucao. 

Selecione as L criaturas de solu¢ado com as avaliacgdes mais altas para que 
sobrevivam e passem a geracao seguinte. 

Elimine as (N- L) criaturas de solugao que nao sobreviveram. 

Crie (N - L) novas criaturas de solugao dentre as L criaturas de solucao 
sobreviventes: 


(1) Fazendo cédpias das L criaturas sobreviventes. Introduza pequenas variacdes 
aleatérias em cada cépia; ou 

(2) Crie criaturas de solugdo adicionais combinando partes do cédigo genético 
(usando reproducgao “sexual”, ou combinando porcdes dos cromossomos) das L 
criaturas sobreviventes; ou 

(3) Faga uma combinacao entre (1) e (2). 


Determine se deve continuar a evoluir: 
Melhoria = (avaliagado mais alta nesta geracao) - (avaliagcao mais alta na 
geracao anterior). 
Se Melhoria < Limiar de Melhoria, entao terminamos. 
A criatura de solucao com a avaliagado mais elevada da ultima geracao de 
evolugao tem a melhor solucao. Aplique a solucdo definida por seu cddigo 
genético ao problema. 


Decisdées importantes de projeto 
No esquema simples acima, 0 projetista precisa determinar desde o inicio: 


Parametros principais: 

N 

L 

Limiar de Melhoria. 

O que representam os numeros do cddigo genético e como a solucao 4 
calculada a partir do cédigo genético. 

Um método para determinar as NW criaturas de solucdao da primeira geracao. De 
modo geral, essas nao precisam ser mais do que tentativas “razodaveis” de se 
chegar a uma solucdao. Se essas solucédes de primeira geracao forem muito 
avancadas, o algoritmo evolutivo pode ter dificuldade para chegar a uma boa 
solugao. Geralmente, 6 interessante criar as primeiras criaturas de soluc¢ao com 
caracteristicas razoavelmente distintas. Isso vai ajudar a impedir que o processo 
evolutivo simplesmente encontre uma solucao ideal “localmente”. 

O modo de avaliar as solucoes. 

Como as criaturas de solucao sobreviventes se reproduzem. 


Variacdes 


Sao viaveis muitas variacdes do que vimos acima. Por exemplo: 


Ndo é preciso haver um numero fixo de criaturas de solucao sobreviventes (L) 
em cada geracao. A(s) regra(s) de sobrevivéncia pode(m) dar margem a um 
numero variavel de sobreviventes. 

Ndo é preciso haver um numero fixo de novas criaturas de solucao criadas em 
cada geracao (WN - L). As regras de procriag¢ao podem ser independentes do 
tamanho da populacao. A procriacao pode estar relacionada com a sobrevivéncia, 
permitindo assim que as criaturas de solucao mais aptas procriem mais. 

A decisao quanto a continuar ou nao a evoluir pode ser variada. Ela pode levar 
em conta mais do que apenas a criatura de solu¢ao com a melhor avaliacgao da 
geracado (ou geracdes) mais recente(s). Pode levar também em conta uma 
tendéncia que vai além das duas Uultimas gerac6ées. 
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Ano US$ Log ($) 
1968 1.00000000 0 

1969 0.85000000 "0.16252 
1970 0.60000000 "0.51083 
1971 0.30000000 "-1.20397 
1972 0.15000000 "-1.89712 
1973 0.10000000 "2.30259 
1974 0.07000000 "2.65926 
1975 0.02800000 "3.57555 
1976 0.01500000 "4.19971 
1977 0.00800000 "4.82831 
1978 0.00500000 "5.29832 
1979 0.00020000 "6.21461 
1980 0.00130000 "6.64539 
1981 0.00082000 "7.10621 
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Ano US$ Log ($) 
1995 0.00000700 -11.8696 
1996 0.00000500 -12.2061 
1997 0.00000300 "12.7169 
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2000 0.00000080 "14.0387 
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Ano Mbits Bits 

1971 921.6 "9.216E+08B 
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Ano Mbits Bits 
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Functional Imaging of Cortical Dynamics”, Nature Reviews Neuroscience 5 (novembro de 
2004): 874-85. 


As principais ferramentas para mapeamento do cérebro estao apresentadas neste 
diagrama. Suas capacidades sao indicadas pelos retangulos sombreados. 

A resolucao espacial refere-se a menor dimensdo que pode ser medida com uma 
técnica. A resolucado temporal 6 o tempo ou duracdao da tomada de imagem. Ha 
vantagens e desvantagens em cada técnica. Por exemplo, o EEG (eletroencefalograma), 
que mede “ondas cerebrais” (sinais elétricos dos neurdénios), pode medir ondas 
cerebrais muito rapidas (que ocorrem em breves intervalos de tempo), mas s6 podem 
captar sinais proximos da superficie do cérebro. 

Em contraste, a IRMf (imagem por ressonancia magnética funcional), que usa uma 
maquina especial de IRM para medir o fluxo sanguineo aos neurénios (indicando 
atividade neuronal), pode atingir uma profundidade bem maior no cérebro (e na coluna 
vertebral) e com resolucao maior, chegando a dezenas de microns (milionésimos de 
metro). No entanto, a IRMf opera muito lentamente em comparacao com o EEG. 

Estas sdo técnicas nado invasivas (que nao exigem cirurgia ou remédios). O MEG 
(magnetoencefalograma) é outra técnica nao invasiva. Ele detecta campos magnéticos 
gerados pelos neurénios. O MEG e a EEG podem indicar eventos com uma resolucao 
temporal de 1 milissegundo, mas sao melhores do que a IRMf, que, na melhor hipdtese, 
pode indicar eventos com uma resolucao de varias centenas de milissegundos. O MEG 
também localiza com precisdao fontes nas areas primarias da audicao, somatossensorial 
e motora. 

O mapeamento dptico cobre quase toda a gama de resolucdes espaciais e temporais, 
mas é invasivo. Os VSDI (sigla em inglés para corantes sensiveis a voltagem) sdo o 
método mais sensivel de medicao da atividade cerebral, mas limitam-se a medidas 
proximas da superficie do cértex dos animais. 

O cértex exposto 6 coberto por uma camara selada e transparente; depois de ser 
tingido com um corante sensivel a voltagem apropriada, ele 6 iluminado por luzes e 
uma sequéncia de imagens é tirada com uma camera de alta velocidade. Outras 
técnicas 6pticas usadas no laboratério incluem imagens idnicas (tipicamente fons de 
calcio ou de sddio) e sistemas de mapeamento fluorescente (imagens confocais e 
imagens multifoténicas). 

Outras técnicas de laboratério incluem o PET (sigla em inglés para tomografia por 
emissdao de positrons, uma técnica de mapeamento da medicina nuclear que produz 
uma imagem em 3D), 2-DG (histologia pdés-morte por 2-deoxiglucose, ou andalise de 
tecidos), les6es (envolve danos aos neurénios num animal, observando-se os efeitos), 


grampeamento de membrana (para medir correntes idnicas através das membranas 
bioldgicas) e microscopia eletrénica (usando um feixe de elétrons para examinar 
tecidos ou células numa escala muito fina). Essas técnicas também podem ser 
integradas com mapeamento 6ptico. 
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22. Resolucao espacial em nanémetros (nm) de técnicas destrutivas de mapeamento, 1983- 
2011: 
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23. Resolucao espacial em microns (um) de técnicas de mapeamento nado destrutivo em 
animais, 1985-2012: 
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Capitulo 11: Objecdes 


1. Paul G. Allen e Mark Greaves, “Paul Allen: The Singularity Isn’t Near”, Technology Review, 
12 de outubro de 2011, http://www.technologyreview.com/blog/guest/27206/. 


oe ITRS, “International Technology Roadmap for Semiconductors”, http:// 
www.itrs.net/Links/2011ITRS/Home2011.htm. 


3. Ray Kurzweil, The singularity is near (Nova York: Viking, 2005), capitulo 2. 


4. A nota 2 de Allen e Greaves, “The Singularity Isn’t Near”, diz 0 seguinte: “Estamos 
comecando a nos aproximar do poder de computacao de que poderiamos precisar para 
apoiar esse tipo de simulacao cerebral macica. Computadores da classe petaflop (tal 
como o BlueGene/P da IBM, usado no sistema do Watson) estado disponiveis 
comercialmente agora. 


Computadores da classe exaflop ja estado na prancheta. Esses sistemas poderiam 
produzir a capacidade computacional bruta necessaria para simular os padrées de 
disparo de todos os neurénios de um cérebro, embora hoje isso aconteca muitas vezes 
mais lentamente do que aconteceria num cérebro real”. 


5. Kurzweil, The singularity is near, capitulo 9, secao intitulada “The Criticism from 
Software” (pp. 435-42). 


6. Ibid., capitulo 9. 


7. Embora_ nao seja possivel determinar com precisdo o conteudo de informacées do 
genoma, em funcao dos pares de bases repetidos, ele é claramente muito menor do que 
os dados totais nao comprimidos. Eis duas abordagens para estimar o conteudo 
comprimido de informacgao do genoma, ambas demonstrando que uma faixa de 30 a 100 
milhées de bytes 6 conservadoramente alta. 


1. Em termos de dados nao comprimidos, ha 3 bilhdes de degraus de DNA no cédigo 
genético humano, cada um codificando 2 bits (pois ha quatro possibilidades para cada 
par de bases de DNA). Logo, 0 genoma humano tem cerca de 800 milhées de bytes nao 
comprimidos. O DNA nao codificante era chamado antes de “DNA lixo”, mas hoje fica 
claro que ele tem um papel importante na expressdo genética. Contudo, ele tem uma 
codificagao pouco eficiente: ha redundancias macicas (por exemplo, a sequéncia 
chamada “ALU” repete-se centenas de milhares de vezes), algo de que os algoritmos de 
compressao podem tirar proveito. 

Com a recente explosdo de bancos de dados genéticos, ha muito interesse na 
compressdo de dados genéticos. Trabalhos recentes sobre a aplicacdo de compressao 
de dados-padrao a dados genéticos indicam que é vidvel reduzir os dados em 90% 
(para uma compressao perfeita de bits). Hisahiko Sato et al., “DNA Data Compression in 
the Post Genome Era”, Genome _— Informatics 12 (2001): 512-14, 
http://www. jsbi.org/journal/GIW01/GIW01P130.pdf. 

Logo, podemos comprimir o genoma para uns 80 milhdées de bytes sem perda de 
informacgoes (o que significa que podemos reconstruir perfeitamente 0 genoma nao 
comprimido com todos os seus 800 milhées de bytes). 

Agora, pense que mais de 98% do genoma nao codifica proteinas. Mesmo depois de 
uma compressdao de dados-padrao (que elimina redundancias e usa a consulta a 
diciondarios para aS sequéncias comuns), 0 conteUdo algoritmico das regides nao 
codificadas parece ser muito baixo, o que significa que 6 provavel que possamos 
codificar um algoritmo que realizaria a mesma funcao com menos bits. Entretanto, 
como ainda estamos no inicio do processo de engenharia reversa do genoma, nao 
podemos fazer uma estimativa confiavel sobre essa reducao adicional com base num 
algoritmo funcionalmente equivalente. Portanto, estou usando uma faixa de 30 a 100 
milhées de bytes de informacao comprimida no genoma. A parte superior dessa faixa 
presume apenas a compressao de dados e nenhuma simplificagao do algoritmo. Apenas 
uma porcao (embora seja a maior) dessa informacao caracteriza 0 projeto do cérebro. 





2. Outra linha de raciocinio 6 a seguinte. Apesar de 0 genoma humano conter cerca 
de 3 bilhdes de bases, s6 uma pequena porcentagem, como mencionado acima, 
codifica proteinas. Pelas estimativas atuais, ha 26 mil genes codificando proteinas. Se 
presumirmos que esses genes tém, em média, 3 mil bases de dados uteis, isso totaliza 
apenas 78 milhdes de bases. Uma base de DNA exige apenas 2 bits, o que se traduz em 
cerca de 20 milhdes de bytes (78 milhées de bases dividido por quatro). Na sequéncia 
de codificacdao de proteinas de um gene, cada “palavra” (cédon) de trés bases de DNA 
se traduz num aminoacido. Ha, portanto, 43 (64) cédigos de cédons possiveis, cada um 
consistindo em trés bases de DNA. Ha, porém, apenas 20 aminoacidos em acao, mais 
um cdédon de parada (sem aminoacido) entre os 64. O resto dos 43 cédigos é usado 
como sinénimo dos 21 uteis. Embora sejam necessarios 6 bits para codificar as 64 
combinacgdes possiveis, sd 4,4 (log221) bits sado necessdarios para codificar 21 
possibilidades, uma economia de 1,6 em 6 bits (cerca de 27%), 0 que nos deixa cerca 
de 15 milhdes de bytes. Além disso, é vidavel aqui um pouco de compressao-padrao com 
base em sequéncias repetidas, apesar de ser possivel muito menos compressdo nessa 
porcao codificadora de proteinas do DNA do que no chamado DNA lixo, que tem 
redundancias macicas. Logo, isso deve deixar 0 numero abaixo de 12 milhdées de bytes. 
Todavia, agora temos de acrescentar informacoes para a porcao nao codificada do DNA 
que controla a expressdo genética. Apesar de essa porcao do DNA formar a maior parte 
do genoma, ela parece ter um nivel mais baixo de contetdo de informac6ées, e esta 
repleta de redunddancias. Estimando que se iguale ao numero aproximado de 12 
milhédes de bytes de DNA codificador de proteinas, chegamos novamente a cerca de 24 
milhées de bytes. Segundo essa perspectiva, a estimativa de 30 a 100 milhdes de bytes 
é conservadoramente alta. 


8. Dharmendra S. Modha et al., “Cognitive Computing”, Communications of the ACM 54, n. 
8 (2011): 62-71, http://cacm.acm.org/magazines/ 2011/8/114944-cognitive- 
computing/fulltext. 





9. Kurzweil, The singularity is near, capitulo 9, secao intitulada “The Criticism from 
Ontology: Can a Computer Be Conscious?” (pp. 458-69). 


10. Michael Denton, “Organism and Machine: The Flawed Analogy”, in Are We Spiritual 
Machines? Ray Kurzweil vs. the Critics of Strong Al (Seattle: Discovery Institute, 2002). 


11. Hans Moravec, Mind Children (Cambridge, MA: Harvard University Press, 1988). 


Epilogo 


1. “In U. S., Optimism about Future for Youth Reaches All-Time Low”, Gallup Politics, 2 de 
maio de 2011, http://www.gallup.com/poll/147350/optimism-future-youth-reaches-time- 
low.aspx. 


2. James C. Riley, Rising Life Expectancy: A Global History (Cambridge: Cambridge 
University Press, 2001). 


3. J. Bradford DeLong, “Estimating World GDP, One Million b.C.-Present”, 24 de maio de 
1998, http://econ161.berkeley.edu/TCEH/1998 Draft/World_GDP/Estimating_World_ 
GDP.html, e http://futurist.typepad.com/my_weblog/2007/07/economic-growth.html. Ver 
também Peter H. Diamandis e Steven Kotler, Abundance: The Future Is Better Than You 
Think (Nova York: Free Press, 2012). [Abunddancia: o futuro 6 melhor do que vocé imagina. 
Sao Paulo: HSM, 2012.] 


4. Martine Rothblatt, Transgender to Transhuman (edicao privada, 2011). Ela explica como 
uma trajetoria similarmente rapida de aceitacdo deve ocorrer para os “trans-humanos”, 
por exemplo, mentes nao biolégicas, mas convincentemente conscientes, conforme 
discutido no capitulo 9. 


5. O trecho a seguir de The singularity is near, capitulo 3 (pp. 133-35), de Ray Kurzweil 
(Nova York: Viking, 2005), discute os limites da computacao com base nas leis da fisica: 


Os limites extremos dos computadores sao profundamente elevados. Com base no 
trabalho do professor Hans Bremermann da Universidade da Califérnia em Berkeley e 
do tedrico da nanotecnologia Robert Freitas, Seth Lloyd, professor do MIT, estimou a 
capacidade maxima de computacdo, de acordo com as leis conhecidas da fisica, de um 
computador pesando um quilo e ocupando um volume de um litro - mais ou menos o 
peso e o tamanho de um pequeno laptop - que ele chamou de “o laptop supremo”. 

[Nota: Seth Lloyd, “Ultimate Physical Limits to Computation”, Nature 406 (2000): 
1.047-54. 

[Um dos primeiros trabalhos sobre os limites da computacao foi escrito por Hans J. 
Bremermann em 1962: Hans J. Bremermann, “Optimization Through Evolution and 
Recombination”, jn M. C. Yovits, C. T. Jacobi, C. D. Goldstein, orgs., Se/fOrganizing 
Systems (Washington, D.C.: Spartan Books, 1962), pp. 93-106. 

[Em 1984, Robert A. Freitas Jr. tomou por base o trabalho de Bremermann em seu 
“Xenopsychology”, Robert A. Freitas Jr, Analog 104 (abril de 1984): 41-53, 
http://www. rfreitas.com/Astro/Xenopsychology.htm#SentienceQuotient. ] 

A quantidade potencial de computacgao aumenta com a energia disponivel. Podemos 
compreender o vinculo entre energia e capacidade computacional conforme segue. A 
energia de uma quantidade de matéria é a energia associada com cada atomo (e 
particula subatémica). Assim, quanto mais atomos, mais energia. Como dito antes, cada 
atomo tem o potencial para ser usado na computacado. Assim, quanto mais atomos, mais 
computacao. A energia de cada atomo ou particula aumenta com a frequéncia de seu 
movimento: quanto maiS movimento, mais energia. A mesma relacao existe para o 
potencial de computacgao: quanto maior a frequéncia do movimento, mais computacao 
cada componente (que pode ser um atomo) pode realizar. (Vemos isso nos chips atuais: 
quanto maior a frequéncia do chip, maior a velocidade de computacao.) 








Assim, existe uma relacao direta e proporcional entre a energia de um objeto e seu 
potencial para realizar computacao. A energia potencial num quilo de matéria 6 muito 
grande, como sabemos em funcao da equacao de Einstein EF = mc’. A velocidade da luz 
ao quadrado é um numero bem grande: aproximadamente 10!” metros?/segundo?. O 
potencial de computacao da matéria também é governado por um numero muito 
pequeno, a constante de Planck: 6,6 x 10734 joule-segundo (um joule é uma medida de 
energia). Essa 6 a menor escala a qual podemos aplicar a energia para computacao. 
Obtemos o limite tedérico para que um objeto compute, dividindo a energia total (a 
energia média de cada atomo ou particula vezes o numero dessas particulas) pela 
constante de Planck. 

Lloyd mostra que a capacidade potencial de computacdao de um quilo de matéria 4 
igual a pi vezes a energia dividido pela constante de Planck. Como a energia 6 um 
numero muito grande e a constante de Planck 6 tao pequena, essa equacao gera um 
numero extremamente grande: cerca de 5 x 10°° operacées por segundo. 

[Nota: tm x energia maxima (10!” kg x metro*/segundo2) / (6,6 x 10734 joule- 
segundo) = ~ 5 x 10°° operacées/segundo.] 

Se relacionarmos esse valor com a estimativa mais conservadora da capacidade do 
cérebro humano (1019 cps e 10! humanos), ele representa o equivalente a cerca de 5 
bilhdes de trilhdes de civilizagco6es humanas. 

[Nota: 5 x 10°° cps equivale a 5 x 102! (5 bilhdes de trilhdes) de civilizacdes 
humanas (cada uma requerendo 1029 cps).] 

Se usarmos 0 valor de 10!® cps que, creio, sera suficiente para a emulacao funcional 
da inteligéncia humana, o laptop supremo funcionaria com o equivalente ao poder 
cerebral de 5 trilhées de trilhées de civilizagd6es humanas. 

[Nota: Dez bilhdes (101°) de humanos a 10!® cps cada totalizam 102° cps para a 
civilizagao humana. Logo, 5 x 10°° cps equivalem a5 x 1024 (5 trilhdes de trilhdes) de 
civilizagoes humanas. ] 

Esse laptop poderia realizar o equivalente a todo pensamento humano dos Uultimos 10 
mil anos (ou seja, 10 bilhédes de cérebros humanos operando durante 10 mil anos) em 
um décimo milésimo de nanossegundo. 

[Nota: Essa estimativa adota a premissa conservadora de que tivemos 10 bilhdes de 
humanos nos ultimos 10 mil anos, o que obviamente nado é€ 0 caso. O numero de seres 
humanos tem aumentado gradualmente desde o passado, atingindo cerca de 6,1 
bilhdes em 2000. Um ano tem 3 x 10” segundos, e ha 3 x 101! segundos em 10 mil 
anos. Assim, usando a estimativa de 102° cps para a civilizacao humana, 0 pensamento 
humano durante 10 mil anos certamente equivale a nao mais do que 3 x 1037 calculos. 
O laptop supremo realiza 5 x 10°° cadlculos num segundo. Logo, para simular 10 mil 
anos de pensamentos de 10 bilhédes de seres humanos, ele levaria cerca de 10}3 
segundos, que € um décimo milésimo de nanossegundo.] 

Mais uma vez, é preciso fazer algumas adverténcias. Converter toda a massa de nosso 
laptop de um quilo em energia é, basicamente, o que acontece numa explosao 
termonuclear. Naturalmente, nao queremos que o laptop exploda, mas que mantenha 
sua dimensao de um litro. Isso vai exigir uma embalagem bastante caprichada, para 


dizer o minimo. Analisando a entropia maxima de tal aparelho, Lloyd mostra que tal 
computador teria uma capacidade teérica de memoria de 102! bits. E dificil imaginar 
tecnologias que chegariam a atingir esse limite. Mas podemos imaginar prontamente 
tecnologias que chegam razoavelmente préximo dele. Como o projeto da Universidade 
de Oklahoma mostra, ja demonstramos a capacidade de armazenar pelo menos 50 bits 
de informacao por atomo (embora apenas num pequeno numero de atomos, até agora). 
Armazenar 1027 bits de memoria nos 102° atomos de um quilo de matéria, portanto, 
pode ser viavel com o tempo. 

Mas, como muitas propriedades de cada atomo podem ser exploradas para o 
armazenamento de informagdes - como sua posicao precisa, seu spin e o estado 
quantico de todas as suas particulas -, provavelmente podemos nos sair melhor do que 
102” bits. O neurocientista Anders Sandberg estima a capacidade total de 
armazenamento de um atomo de hidrogénio como sendo da ordem de 4 milhées de 
bits. Essas densidades ainda nao foram demonstradas, porém, e por isso usaremos a 
estimativa mais conservadora. 

[Nota: Anders Sandberg, “The Physics of the Information Processing Superobjects: 
Daily Life Among the Jupiter Brains”, fournal of Evolution and Technology 5 (22 de 
dezembro de 1999), http://www.transhumanist.com/volume5/Brains2.pdf.] 

Como discutido acima, 1042 cdlculos por segundo podem ser atingidos sem se 
produzir calor significativo. Com o emprego pleno de técnicas de computacao 
reversiveis, uSando-se projetos que geram baixos niveis de erros e permitindo uma 
quantidade razoavel de dissipacdo de energia, devemos chegar em algum ponto entre 
1042 e 10°° calculos por segundo. 

O terreno de projeto entre esses dois limites € complexo. Examinar as questdes 
técnicas que surgem quando passamos de 10%? para 10°° esta além do escopo deste 
capitulo. Devemos lembrar, porém, que o modo como isso vai se dar nao sera 
comecando pelo limite final de 10°° e recuando com base em diversas consideracées 
praticas. Na verdade, a tecnologia vai continuar a avancgar, sempre usando sua 
realizacao mais recente para progredir até o nivel seguinte. Assim, quando chegarmos a 
uma civilizacdo com 104? cps (para cada quilo), os cientistas e os engenheiros dessa 
época vao usar sua inteligéncia nao biolédgica essencialmente vasta para descobrir 
como chegar a 1043, depois 1044 e assim por diante. Minha expectativa é que vamos 
nos aproximar muito dos limites supremos. 

Mesmo com 1042 cps, um “computador portatil supremo” de um quilo seria capaz de 
realizar o equivalente a todo pensamento humano dos ultimos 10 mil anos 
(presumindo-se 10 bilhdes de cérebros humanos por 10 mil anos) em 10 
microssegundos. 

[Nota: Ver nota acima. 104? cps é um fator de 10° vezes menos do que 10°° cps, e 
assim, um décimo milésimo de nanossegundo torna-se 10 microssegundos.] 

Se examinarmos a tabela de Crescimento Exponencial da Computacao (capitulo 2), 
veremos que se estima que essa quantidade de computacao estara disponivel por mil 
délares em 2080. 
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medicina e, 
métodos biolégicos para, 
onipresen¢a da, 


otimizacao da identificagao de padroes em, 
ver também neocortex digital 
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Interpretacao dos sonhos, A (Freud) 
intuigao, natureza linear da 
invariancia, na identificacdo de padrées 
e emulacao do cérebro em, 
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e a improbabilidade de outra espécie inteligente, 
objecdes a, 
predicoes baseadas na, 
tecnologia da comunica¢ao e, 
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reducao de dados no, 

nervo dptico 
canais do, 

nervos motores 

nervos sensoriais 

neurdnios 

neurdnios da lamina | 

neurdénios fusiformes 

neurotransmissores 

new kind of science, A (Wolfram) 

Newell, Allen 

Newton, Isaac 

Nietzsche, Friedrich 

nomes, recordacao de 

noradrenalina 

norepinefrina 

Nuance Speech Technologies 

nucleo accumbens 

nucleo geniculado lateral 

nucleo geniculado medial 

nucleo ventromedial posterior (VMpo) 

Numenta 

NuPIC 


Oluseun, Oluseyi 

OmniPage 

On intelligence (Hawkins e Blakeslee) 
organismos simulados, evolucao dos 
Orgaos sensoriais 

origem das espécies, A (Darwin) 
oxitocina 


pacientes com cérebro partido 
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no cérebro de mamiferos, 
recursao no, 
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programacao linear 
Projeto Blue Brain, 
Projeto do Genoma Humano 


proteinas, engenharia reversa das 
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